Форма реальности. Скрытая геометрия стратегии, информации, общества, биологии и всего остального

Джордан Элленберг
100
10
(1 голос)
1 0

Аннотация: Эта книга изменит ваше представление о мире. Джордан Элленберг, профессор математики и автор бестселлера МИФа «Как не ошибаться», показывает всю силу геометрии – науки, которая только кажется теоретической.

Книга добавлена:
6-10-2023, 08:36
0
252
115
Форма реальности. Скрытая геометрия стратегии, информации, общества, биологии и всего остального
Содержание

Читать книгу "Форма реальности. Скрытая геометрия стратегии, информации, общества, биологии и всего остального"



КАРТА ВСЕХ СЛОВ

Представьте, что кто-то пытается вам описать, как выглядит штат Висконсин, сообщив список городов и указав расстояние между любыми двумя из них. Да, в принципе это скажет вам, какую форму имеет Висконсин и как в нем располагаются города. Однако на практике ни один человек (даже такой любитель чисел, как я) не сможет ничего сделать с длинным списком названий и чисел. Наши глаза и мозг воспринимают информацию в форме карт.

Кстати, не совсем очевидно, что эти расстояния опишут вам форму карты! Предположим, в Висконсине всего три города. Знание расстояний между любыми двумя из них означает, что у нас есть длины трех сторон треугольника, а согласно упоминавшемуся в главе 1 утверждению Евклида, если вы знаете три стороны треугольника, то знаете и его форму. Однако куда больше усилий нужно, чтобы доказать, что можно восстановить форму, образованную произвольным множеством точек, если вы знаете расстояния между любыми двумя из них[321]. Мы с вами на основе этих данных можем составить разные карты, но мою карту можно будет перевести в вашу с помощью движения – переноса и поворота, без изменения формы[322].

Зачем представлять форму Висконсина в таком сложном для улавливания табличном виде, когда карты уже существуют? Незачем. Однако для других – негеографических – сущностей мы можем ввести понятие расстояния и с его помощью создать новые виды карт. Например, мы могли бы составить карту индивидуальных черт личности. Что бы мы подразумевали под расстоянием между двумя чертами? Самый простой способ – спросить людей. В 1968 году[323] психологи Сеймур Розенберг, Карнот Нельсон и П. С. Вивеканантан раздали студентам колледжа пакеты из 64 карточек с различными чертами и попросили сгруппировать карточки так, чтобы в одной группе оказались черты, которые, по их мнению, могут принадлежать одному человеку. Тогда расстояние между двумя чертами можно определить по частоте, с которой студенты объединяли соответствующие карточки. Слова reliable («надежный») и honest («честный») часто встречались вместе, потому что они близки по смыслу; а слова good-natured («добродушный») и irritable («раздражительный») – реже, потому что плохо сочетаемы и должны располагаться подальше друг от друга[324].

Как только получите такие числа, можете попробовать составить карту черт личности, чтобы расстояние между ними на бумаге соответствовало расстояниям, установленным в эксперименте.

Возможно, у вас не выйдет! А вдруг вы обнаружите, что любые два слова из набора reliable («надежный»), finicky («разборчивый»), sentimental («сентиментальный») и irritable («раздражительный») находятся на одинаковом расстоянии друг от друга? Вы можете попытаться расположить четыре точки на плоскости на одинаковых расстояниях друг от друга, но у вас ничего не получится. (Я настоятельно рекомендую действительно попробовать это сделать, чтобы ваша геометрическая интуиция осознала, почему это невозможно.) Одни множества расстояний можно передать на плоскости, другие – нет. Существует так называемый метод многомерного шкалирования, который позволяет нарисовать карту, если вы соглашаетесь, чтобы расстояния на ней только приблизительно соответствовали найденным. (Кстати, вам нужно быть готовым к тому, что студенты колледжа, участвующие в психологических экспериментах за деньги на пиво, не обеспечивают точность на уровне электронного микроскопа.) Вы получите следующую картину:

Думаю, вы согласитесь, что эта схема отражает кое-что в геометрии личности. (Оси на рисунке нарисованы исследователями: это их интерпретация того, что на этой карте в действительности означают направления[325].)

Кстати, в трех измерениях сделать одинаковыми все шесть расстояний очень просто: вы размещаете четыре точки в вершинах правильного тетраэдра.

Чем больше размерность пространства, тем точнее вы сможете разместить на своей карте точки так, чтобы расстояния между ними соответствовали измеренным. Это означает, что данные могут сказать вам, в пространстве какой размерности они «хотят» быть[326]. Политологи определяют сходство между членами конгресса на основе их голосования, затем помещают конгрессменов на карту так, чтобы рядом оказались голосовавшие аналогичным образом. Знаете, какая размерность пространства нужна, чтобы вполне качественно расположить американских сенаторов в соответствии с их голосованиями? Всего единица. Вы можете расставить[327] сенаторов вдоль по одной прямой – от самого левого (Элизабет Уоррен из Массачусетса) до самого правого (Майкл Ли из Юты) – и тем самым успешно отразить большую часть их наблюдаемого поведения при голосовании. Так было на протяжении десятилетий; когда же этого не происходило, причиной был настоящий идеологический раскол в демократической партии между крылом, поддерживающим гражданские права, и преимущественно южной фракцией, остававшейся воинственно сегрегационистской. Некоторые полагают, что Соединенные Штаты движутся к новой перестройке, где традиционное разделение «левые против правых» не охватывает всей картины. Например, существует популярная «теория подковы», которая утверждает, что крайне левое и крайне правое крыло в американской политике, расположенные в чисто линейной модели максимально далеко друг от друга, на самом деле весьма близки. С геометрической точки зрения теория подковы утверждает, что политика не вписывается в прямую, а требует плоскости.

Если это правда и на противоположных концах подковы окажется достаточно избирателей, чтобы выбрать себе представителей в конгрессе, мы увидим это по данным голосований: одномерная модель конгресса будет все менее и менее точной. Пока этого еще не произошло.

Для больших массивов данных двумерного пространства редко бывает достаточно. Группа специалистов Google под руководством Томаша Миколова разработала гениальное математическое устройство Word2vec, которое можно назвать картой всех слов. Нам больше не нужно полагаться на студентов и карточки, чтобы собрать информацию о том, какие слова сочетаются между собой. Программа Word2vec, обученная на наборе текстов из Google News объемом шесть миллиардов слов, присваивает каждому английскому слову точку в трехсотмерном пространстве. Нарисовать это трудно, но помните, что точно так же, как точка в двумерном пространстве задается двумя числами (широтой и долготой), точка в трехсотмерном пространстве – это всего лишь список из 300 чисел: долгота, широта, высота, мелкота, густота, прямота, частота, круглота и т. д. и т. п., насколько вам поможет словарь рифм. В трехсотмерном пространстве тоже есть понятие расстояния, которое не особо отличается от известного нам расстояния на плоскости[328]. Цель Word2vec – разместить похожие слова в точках, находящихся недалеко друг от друга.

Что делает слова похожими? Вы можете представить, что у каждого слова есть облако соседей – слов, которые часто появляются вместе с ним в наборе текстов Google News. В первом приближении Word2vec расценивает два слова как похожие, если их облака соседей сильно перекрываются. Во фрагменте текста, окружающего слова glamour («очарование»), runway («подиум») или jewel («драгоценность»), вы можете ожидать найти слова stunning («оглушительный, ошеломительный») или breathtaking («захватывающий»), но не trigonometry («тригонометрия»). А потому слова stunning и breathtaking, в облаках которых встречаются общие слова glamour, runway и jewel, можно считать похожими, отражая тот факт, что эти два почти синонимичных слова часто встречаются в одинаковых контекстах. Word2vec ставит их на расстоянии 0,675 друг от друга. На самом деле из миллиона слов, которые умеет кодировать Word2vec, слово breathtaking – ближайшее к слову stunning. Для сравнения: расстояние от stunning до trigonometry составляет 1,403.

Как только у нас появляется представление о расстояниях, можно говорить об окружностях и кругах. (Хотя, возможно, находясь в трехсотмерном пространстве, было бы лучше говорить об их многомерных аналогах – сферах и шарах.) Круг радиуса 1 вокруг слова stunning содержит 43 слова, в том числе spectacular («зрелищный, эффектный»), astonishing («изумительный, поразительный»), jaw-dropping («крайне удивительный, феерический») и exquisite («изумительный, изысканный»). Машина явно улавливает нечто в этом слове, включая то, что оно может обозначать как красоту, так и удивление. Я должен отметить, что тут не происходит никакого численного выделения смысла слов. Это было бы настоящим подвигом. Вся стратегия строится вовсе не для этого. Расстояние от слова hideous («страшный, омерзительный») до stunning всего 1,12; хотя они почти противоположны по значению, вы вполне можете представить, что они часто появляются в общем контексте, например: «Этот свитер реально __________». Круг слов радиусом 0,9 от teh включает слова ther, hte, fo, tha, te, ot и thats – это даже не слова, не то что не синонимы, однако Word2vec правильно распознает, что все они могут появляться в контекстах с большим количеством опечаток.

Нам нужно поговорить о векторах. Формальное определение этого термина выглядит устрашающе, но его смысл можно свести к следующему. Точка – это существительное. Она отражает какую-то вещь: место, название, слово. Вектор – это глагол. Он указывает, что нужно делать точке. Милуоки (штат Висконсин) – это точка. «Двигайтесь на тридцать миль на запад и две мили на север» – это вектор. Если вы приложите этот вектор к городу Милуоки, получите город Окономовок.

Как вам описать этот вектор, переносящий вас из Милуоки в Окономовок? Вы могли бы назвать его «вектор на запад до внешнего кольца пригородов». Приложите его к Нью-Йорку[329], и получите город Морристаун (штат Нью-Джерси), или, точнее, природный парк Dismal Harmony («Мрачная гармония») непосредственно к западу от города.

Вы можете перефразировать это по аналогии так: Морристаун относится к Нью-Йорку так же, как Окономовок к Милуоки, как Буанвиль-ан-Мантуа к Парижу, Сан-Херонимо-Икстапантонго к Мехико, а Фараллоновы острова (необитаемое место, бывшая свалка отходов атомной промышленности, а сейчас территория с самой большой плотностью грызунов на планете) – к Сан-Франциско.

Это возвращает нас обратно к слову stunning. Разработчики Word2vec обратили внимание на интересный вектор: тот, который говорит нам, как перейти от слова he («он») к слову she («она»). Можете считать его вектором феминизации. Применив его к слову he, получаете слово she. Что, если применить его к слову king («король»)? Вы получаете точку, которая, как и в случае с парком Dismal Harmony, не попадет в точности в то место, для которого у вас есть слово. Но ближайшее слово – queen («королева»), как в случае парка ближайшим городом был Морристаун. Queen относится к king, как she к he. Это хорошо работает и для других слов: феминизированная версия для слова actor («актер») – actress («актриса»), а для waiter («официант») – waitress («официантка»).

А что насчет слова stunning? Представьте себе: вы получите gorgeous («пышный, великолепный»). Слово gorgeous относится к слову she так же, как stunning к he. Приложите этот вектор в другом направлении, попросив программу Word2vec маскулинизировать stunning, и получите spectacular («зрелищный»). Поскольку эти аналогии представляют собой только приблизительные числовые равенства, они не всегда симметричны: результатом обратной феминизации для spectacular действительно будет stunning, но при маскулинизации слова gorgeous получится magnificent («великолепный»).


Скачать книгу "Форма реальности. Скрытая геометрия стратегии, информации, общества, биологии и всего остального" - Джордан Элленберг бесплатно


100
10
Оцени книгу:
1 0
Комментарии
Минимальная длина комментария - 7 знаков.
Книжка.орг » Математика » Форма реальности. Скрытая геометрия стратегии, информации, общества, биологии и всего остального
Внимание