Иванов-Петров Александр (ivanov_petrov) wrote,
Иванов-Петров Александр
ivanov_petrov

давно я как-то написал http://ivanov-petrov.livejournal.com/1269107.html

"цель систематики: система создается для предсказания поведения объектов-элементов. Мы хотим до экспериментов знать, как - примерно - поведет себя некий объект - и мы можем делать предсказания, исходя из места в системе. К сожалению, пока систематика мало проверяема и потому не поддается проверке экономическими методами. А вот же...

Создается база данных всех научных результатов - точно таким же образом, как считают импакт-фактор журнала или индексы ссылаемости на некого автора. А тут делается по латинским названиям. И устанавливаются простые индексы между названием и - по запросу - ключевым словом. То есть можно запросить, что в top10 делает Musca domestica или там еще какая тварь. Например - мешает, нудит, является возбудителем... переносчиком... спаривается... жрёт объедки... Или относится с другим каким существом. И делаются предсказания по запомненному профилю - относительно других членов рода Musca. Другая муха тоже спаривается... возбудителем... тьфу, переносчиком... жрёт объедки... Ага! Работает! По тому, что знаем об одном виде мух, можем предсказать о другом.

Это понятно. А дальше работает просто алгоритм гугля по базе - и производится автоматическая классификация объектов по сходству сочетаемых с ними слов. Приписывание имен - дело очень тривиальное и лучше мы заменим это на численные индексы. С расшифровкой - отсылкой к картинкам-фотографиям - перечню статей об этой твари и базе соотношений. То есть любой пользователь имеет всё время готовую систематику всех существ, всё время пересматриваемую в соответствии с изменениями массива текстов. Жуки поют, скажем, и тем близки к птицам. И фото тех жуков... Короче, после введения нескольких простых ограничений - выборе текстов только из базы научной литературы и т.д. - получаем работающую систему. В том прямом смысле, что сам алгоритм ее выстраивания будет все время приводить к объединению в группы видов, которые сходным образом "работают" в выборке текстов. У них общие паразиты, общая пища, общее использование человеком и пр. Мы гарантированно будем получать сходство поведения видов исходя из их места в системе - то есть такая система по самому способу свойего устройства будет лучшей из возможных.

Это могут перенять и другие науки, кому надо. И что приятно - приходит окончание споров о том, как лучше делать такую систему, какая является естественной, прогностичной и т.п. Мы всегда будем иметь самую лучшую систему, какую только можно по состоянию наших знаний. Надо лучше? Всего и дел, что наисследовать еще чего-нибудь и добавить в исходный массив текстов новые данные."

и вот А. Шипунов сделал такую штуку http://herba.msu.ru/shipunov/os/k2l/k2l.html http://herba.msu.ru/shipunov/os/homonyms/index.php





вполне получилась небессмысленная штука. Поиск по парам названий высших категорий системы. Работает в большей степени для первых справа уровней, выше начинается некоторый бредок. Впрочем, по ссылкам - презентация. Там на м справа кнопка с объяснениями, как работает.
Tags: biology4
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your IP address will be recorded 

  • 13 comments