Иванов-Петров Александр (ivanov_petrov) wrote,
Иванов-Петров Александр
ivanov_petrov

Минимальный словник

200-словный стандартный список Сводеша с уточнённым переводом с английского, учётом комментариев к нему и подстройкой большинства значений лексем так, как они наиболее часто воспринимаются в английском языке в своём базовом значении.

То есть это самые устойчивые понятия. В некотором смысле - это попытка реконструкции самых базовых, первых понятий человечества.

я
ты
он, она, оно
мы
вы (мн. число)
они
этот, эта, это (максимально ближний предмет)
тот, та, то (максимально удалённый предмет)
здесь, тут (максимально близко)
там (максимально далеко)
кто
что
где
когда
как
не
всё (на свете); также допускается «все (люди)» (all)
много (большое количество)
несколько, немного (среднее количество) (some)
мало (малое количество)
другой (человек), другие (люди)
один
два
три
четыре
пять
шесть
большой (дом, предмет)
длинный (предмет)
широкий
толстый (предмет)
тяжёлый
маленький
короткий
узкий
тонкий (предмет)
женщина
мужчина
человек
ребёнок
жена
муж
мать
отец
зверь (дикое животное)
рыба
птица
собака
змея
дерево
лес
палка («ударил палкой»)
плод (фрукт)
семя (растения)
лист (дерева)
корень (растения)
кора (дерева)
цветок
трава
верёвка
кожа
мясо
кровь
кость
яйцо
рог
хвост
перо (птицы)
волос(ы)
голова
ухо
глаз
нос
рот
зуб
язык
ноготь
нога (стопа)
колено
рука (кисть)
крыло
живот (от пупка до промежности)
шея
спина
грудь
сердце
печень
пить (воду)
есть (кушать)
кусать (зубами); грызть
дуть (о ветре); отдельно допустимо также «дуть на свечу»
дышать
смеяться
видеть
слышать
знать
думать
чувствовать запах; отдельно допустимо также «нюхать ноздрями» (smell)
бояться (опасности)
спать
жить
умирать
убивать
бороться, воевать (с врагом) (fight)
охотиться (в лесу)
ударить (однократно рукой)
резать (предмет ножом)
(раз)рубить (бревно топором) (split)
воткнуть, вонзить (нож) (stab)
царапать
копать, рыть (яму)
плавать («умеет плавать»)
летать
ходить, идти (шагом)
приходить, прийти
лежать
сидеть
стоять
повернуть («идя по дороге, повернуть направо») (turn)
падать (вертикально вниз)
давать
держать (рукой)
сжимать, давить (рукой с силой)
тереть (многократно)
мыть (руки)
вытирать (пыль)
тянуть (на себя)
толкать (вперёд, от себя)
бросать (камень)
привязать; связать (верёвкой)
шить (рубашку)
считать (числа)
сказать («он что-то сказал»)
петь (песню)
играть («дети играют»)
плавать («дерево плавает, не тонет»)
течь («река течёт»)
замёрзнуть («вода замёрзла»)
солнце
луна (полная)
звезда
вода
дождь (средней силы)
река (крупная или средняя)
озеро
море
камень («бросил камень»)
песок
пыль
земля (грунт)
облако
туман (достаточно густой)
небо
ветер
снег
лёд
дым
огонь
зола, пепел (от костра)
гореть («огонь горит»)
дорога (грунтовая)
гора (достаточно высокая)
красный
зелёный
жёлтый
синий
белый
чёрный
ночь
день
год
тёплый (о погоде)
холодный (о погоде)
полный (стакан)
новый
старый (предмет)
хороший (качественный)
плохой (некачественный)
гнилой
грязный (возможно, ребёнок)
прямой (линия, дорога)
круглый
острый (нож)
тупой (нож)
гладкий, ровный (на ощупь)
мокрый
сухой
правильный (верный)
близкий («живёт близко»)
далёкий («живёт далеко»)
правый
левый
у, возле
в («в доме»)
на («на камне»)
с (вместе с кем-то)
и
если
потому что
имя (человека)


-------------------------------

Я сказал, что это базовые понятия. Сами лингвисты такой чуши не говорят (вроде бы), для них это техническое средство при установлении родства языков, и всё. Но: есть энное количество публикаций, где делают разные люди попытки построить именно словарь базовых понятий, основных концептов человечества. Я эти попытки сравнил со списком Сводеша и говорю: в общем, это примерно одно и то же. То есть у Сводеша меньше, те попытки обычно поболе размером, и там есть важные понятия, но это уже другой разговор - по строению и наличию всяких особенно важных слов это примерно те же штуки.

Конечно, другой список можно было бы составить, и больше - но дело в том, что лингвистами список этот не увеличивается, а уменьшается. Его используют для датирования языков, и чем строже отобраны слов, тем достовернее результаты. Как я слышал, вообще-то лучше всего обходиться прямо-таки минимальным списком из 25 слов. Даже 100-словник великоват.

Хотя тут - в 200-словнике - нет "любить" и нет "чистого", нет "испраженений", "эйякуляции", нет "колдуна" или "шамана", нет "рисовать" - мало ли чего. Но в общем - даже странно, отчего список базовых понятий человечества используют только лингвисты и только в целях установления родства языков.

Конечно, в семантике используют - словари Огдена или Гугенхейма, там примерно 1000-1500 базовых слов. Конечно, есть Анна Вежбицкая. Но у Вежбицкой, как оказалось, тоже остаётся много лишних деталей, ей много не надо. Вот её минимальный словарь:


"В течение семи лет, потраченных мною на поиски элементарных смыслов, число предполагаемых кандидатов систематически уменьшалось. В настоящее время я придерживаюсь мнения, что их число колеблется приблизительно от десяти до двадцати. Вот перечень кандидатов, представляющихся мне наиболее подходящими в настоящее время:

хотеть

нечто

не хотеть

некто (существо)

чувствовать

я

думать о...

ты

представлять себе

мир (вселенная)

сказать

это

становиться

быть частью"

http://www.belb.net/obmen/Wierzbicka.htm


"Моя гипотеза состоит в том, что с помощью этих элементов (или их эквивалентов в любом другом естественном языке) окажется возможным истолковать все речевые высказывания и описать все семантические отношения, существующие между различными выражениями."

"Можно ли действительно обойтись без таких слов, как причина, истина, мужской пол, женский пол, существовать, множество, животное, растение, организм, тело, больше, очень, подобный, тот же самый, равный, начало, конец, мочь, хороший, плохой и живой? А таких, как и, не, если и все? Действительно ли можно свести значения этих слов к каким-то более фундаментальным?

Я полагаю, что можно. Причина, по моему мнению, не может рассматриваться как элементарный смысл, потому что она связана со словом если и может быть перефразирована через это слово (ср. Х было причиной Y - если бы не X, то Y не произошло бы). Слово истина связано со словами думать, сказать и, возможно, также хороший (истинно и ложно представляют собой род оценки, подобно красивому и уродливому). Хороший и плохой в свою очередь связаны с желанием. Тело (тело X), вероятно, может быть истолковано как "нечто, о чем можно думать (думают?) как об X". Во всяком случае, тело, конечно, представляет собой "нечто", так же как и растение и животное. Больше и множество связаны с понятием "части". Если что-то существует, то, значит, о нем может быть что-то сказано [То exist is to be "referable to"]; таким образом, существование связано со словами это и сказать (Кентавры не существуют = Нельзя сказать, думая о чем бы то ни было: это кентавр). Начало и конец связаны друг с другом, так же как хороший и плохой. И так далее. Более подробное рассмотрение этих и других отвергнутых кандидатов на положение неопределяемых элементов можно найти в последующих главах."


-----------------
То есть когда люди в самом деле берутся решать какую-то задачу - скажем, создать минимальный словарь, которым можно истолковать все прочие слова - они приходят к очень небольшому числу базовых понятий.

Тут интересно вот что. Скажем, было бы интересно смотреть на минимальные словники, сделанные для разных задач. У меня подозрение - они не совпадут. То есть: можно минимизировать язык до очень небольшого числа форм - но в рамках данной задачи. А для другой тоже будет надо мало, но несколько иных. Отсюда: представляющиеся универсальными задачи минимизации на деле работают с перехлестом. Они делают больше, чем должны - получаемые в таких случаях минимальные наборы не соответствуют ничему, кроме того функционала, который для них придуман. Скажем, минимальная бактерия, минимальный живой организм будет означать только то, что когда люди решили построить минимальную бактерию, у них получилось вот такое-то существо, и ничему больше это не соответствует.
Но это подозрение.

Другое: вроде бы всякие люди очень сильно нуждаются в неких четко ограниченных базовых словарях. Это всякие попытки создать минимальный язык общения, и естественный язык для ИИ, и философы, и задачи перевода - и вообще масса направлений. Пробовали делать перевод? Переводятся только базовые, скажем, а прочие - толкованиями к базовому, это работа семантики на одном языке и минимальное количество перевода. Или это только хуже? Или - множество идей сделать искусственный язык интернационального общения. Делали его на основе базовых словников?

Интересно, пытались ли они использовать имеющиеся минимальные словники - или изобретают подручными средствами своё. То есть занятно сопоставить, какие базовые словники получаются при разных задачах - здесь уже будут, конечно, преимущественно тысячесловники. И интересно, подходят - не подходят - почему одни словники для других задач.
Tags: language2
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your IP address will be recorded 

  • 42 comments