Языки естественного и искусственного происхождения

Создатели: Сорокин Денис и Мухин Алексей.

Планирование

1 Дерево целей

- разделение обязанностей
- поиск информации о понятии языка
- поиск информации о языках естественного происхождения
- поиск информации о языках искусственного происхождения
- создание таблиц и схем по данной информации
- корректировка и доработка

2 Структура проекта

- размещенная на сайте информация в виде текста, схем и таблиц
- презентация проекта

3 План работы (структура)

- разделение обязанностей (с первого дня работы)
- поиск информации о понятии языка (20.01-01.02)
- поиск информации о языках естественного происхождения (20.01-01.02)
- поиск информации о языках искусственного происхождения (20.01-01.02)
- создание таблиц и схем по данной информации (01.02-01.03)
- корректировка и доработка (01.03-01.04)

4 Матрица ответственности

Ответственность равна по отношению к обоим создателями проекта

Информация

Понятие языка

Язык является сущностью процесса передачи воспринятого человеком части или всего реального или воображаемого мира другому человеку или техническому устройству. Язык устанавливает связи знаков между собой. Эта исходная позиция служит основой для формирования средств передачи представлений о предметах, явлениях или процессах реального или воображаемого мира. Упрощенное понимание связей знаков состоит в указании допустимых и недопустимых применений пары, тройки и т.д. знаков для передачи смысла. Соединяя два знака «м» и «ы» получает слово «мы», имеющее вполне определенный смысл местоимения. Соединяя два знака «м» и «ь» получаем слово «мь», едва ли имеющего смысл. Программисты «умудряются» вводить такие слова и придавать им весьма важный смысл идентификатора. Поэтому невозможно категорически говорить какое соединение двух знаков имеет смысл, а какие не имеют. Смысл имеют только те слова из двух знаков, которые явно определены для Интеллсист всеми или некоторыми своими атрибутами и характеристиками, а определение помещено в БЗ или сообщено в запросе. Здесь уместно напомнить, что одно и то же слово может иметь смысл в одной области знания и не иметь в другой. Такое утверждение, в частности, легло в основу формирования понятия ЯПП. Именно человеческая практика в условиях глубокого разделения труда диктует процессы формирования и использования ЕЯ по частям, названным ЯПП.

Язык понимается значительно сложнее, чем рассмотренное правило соединения двух знаков. При соединении трех и более знаков (не обязательно букв) можно передать больший смысл, по сравнению с передачей смысла двумя знаками. Если можно так сказать, то число передаваемых смыслов растет экспоненциально в зависимости от числа соединяемых знаков. Прежде всего, язык характеризуется словарем, конечным (или бесконечным для ФЯ) набором слов из знаков. Долее, в подавляющем большинстве языков имеются правила для соединения через пробел слов из фиксированного или в языке же формируемого словаря. Образуются фразы. Итак, язык - это набор фраз из слов, составляемых по заданным правилам. Совокупность исходного алфавита знаков (символов), конечного набора правил формирования текстов и конечного набора языковых понятий полностью определяет язык. Кроме этого в определение языка должна входить семантика каждой языковой конструкции для точного вычисления смысла текстов определяемого языка. Так приблизительно выглядит определение понятия языка.

Язык полностью определяется грамматикой и словарем из знаков и слов (как последовательности знаков). Назначение грамматики и словаря определяется двумя приложениями: они используются для генерации текстов или для распознавания принадлежности текста языку, который определяется этой грамматикой и словарем. В соответствии с таким делением целей формирования определения языка грамматики подразделяются на порождающие и распознающие грамматики. Такие сорта грамматик рассмотрены.Грамматики можно расчленить на две части: синтаксическую (совокупность правил формирования текстов) и семантическую (совокупность правил вычисления смысла текстов. Любые грамматики являются средством представления семантического знания. Их использование в Интеллсист характеризует интеллектуальность системы.

Передача знаний средствами языка

Конечно, вначале знания свойственны человеку. Однако человек научился передавать свои знания вначале другому человеку, а затем и ВМ. В первые ВМ знания передавались в форме программ, они составили алгоритмическое знание. Передача алгоритмических знаний является специальной деятельностью человека, которая привела к появлению новой специальности - программирование. Программирование является уделом небольшого числа населения (от 0.3% до 3%), поэтому пользователь ВМ вынужден покупать программный продукт. Число ВМ возрастает экспоненциально в последние годы, имеющейся армии программистов стало недостаточным для удовлетворения всех запросов пользователей. Имеются и другие причины, которые поставили задачу привлечения самих пользователей к решению своих задач без программистов. Все эти и другие факторы были достаточно подробно обсуждены. Здесь разговор пойдет об обосновании возможности работы на ВМ без программистов или самостоятельно. А точнее, с точки зрения концептуальной информатики рассмотрим важный вопрос о концепциях синтаксиса, семантики и прагматики, сопоставления понятий языка и смысла и о применении этих концепций при обработке знаний.

Виды языков

Языки бывают естественного происхождения (например языки общения) и искусственного происхождения или формальные языки , разрабатываемые для общения человека с автоматом (компьютером) либо для описания и получения знаний.

-

Пусть X – некоторый алфавит, X = {x1, x2, … , xn} , а S(X) – множество слов над алфавитом X, тогда S(X) – бесконечное и счетное множество.

Формальный язык L(X) – произвольное подмножество S(X).

Формальный язык использует естественный язык как лексическую форму оформления входящих в него абстрактных объектов, как метаязык или язык для описания синтаксиса другого языка. Описываемый метаязыком язык в этом случае называется объектным языком (по отношению к метаязыку).

Формальная грамматика G состоит из совокупностей: T = {t1, t2, … , tk} – множество терминальных символов языка или множество основных понятий языка; N = {n1, n2, …, nm} – множество нетерминальных символов языка или вспомогательных понятий, обозначений конкретных классов слов, например, глаголов или предлогов, причем во множестве N содержится n0 – начальный символ из N; P = {p1, p2, …, pq} – система подстановок (продукции) слов вида s_{1}(x)\subset S(X) в слова s_{2}(x)\subset S(X) или замен всех слов s1(x) в рассматриваемой системе соотношений на слова вида s2(x) .

Язык (множество слов S(X)) задается грамматикой G(S) – структурой правил, которые позволяют порождать все слова s\in S(x) и только их.

Грамматический анализ – процесс редукции к нетерминальному символу или слову.

Множество W = N\cup T – словарь грамматики G. Правила вывода – это непустое множество правил вида f\to g, где f, g\in W, а «\to» – отношение вида «левое (можно) заменить на правое».

Слово w_1\in W выводимо из слова w_2\in W с помощью правила p_1\colon f_1\to g_1, если w_1=v_{1}f_{1}v_{2}, w_{2}=v_{1}g_{1}v_{2}, p_{1}\in P. Последовательность f = f_{0}; f_{1}; f_{2}; \ldots; f_t = g, t \ge 1 называется выводом g из f, если fi+1 выводимо из fi для всех 0\le i\le n. Признаком завершения процесса (последовательности) вывода является отсутствие слова, выводимого из g.

Пример. Опишем элементы естественного, например, русского языка в терминах формальных грамматик. Алфавит языка X = {А, а, Б, б, … , Я, я, ., ,, :, ;, ., !, ?, », », (, )}, T={<корни>, <приставки> и т.д.}, N = {предложение, подлежащее, сказуемое, глагол, местоимение и т.д.}, n0 = «предложение» . Например, пусть

Т = {арбуз, банан, красный, греет, загорает, бок},

N = {сказуемое, подлежащее, определение, дополнение, группа подлежащего, группа сказуемого},

n0 = {предложение} ,

P = {p1: предложение \to (группа подлежащего), (группа сказуемого ),

p2: группа подлежащего \to (определение)(подлежащее) ,

p3: группа сказуемого \to (сказуемое) (дополнение) ,

p4: определение\to «красный» ,

p5: подлежащее\to «арбуз» ,

p6: подлежащее \to»банан» ,

p7: сказуемое \to «греет» ,

p8: дополнение \to «банан» ,

p9: дополнение \to «бок»} .

Тогда справедливы следующие выводы:

предложение (группа подлежащего)(группа сказуемого) \to

(определение) (подлежащее) (группа сказуемого) \to

(определение) (подлежащее) (сказуемое) (дополнение) \to

«красный» (подлежащее) (сказуемое )(дополнение) \to

«красный арбуз» (сказуемое) (дополнение) \to

«красный арбуз греет» (дополнение) \to

«красный арбуз греет бок».

Таким образом, мы по формальным правилам построили предложение естественного языка.

Различают четыре основных типа формальных грамматик.

Грамматика типа 0 (G–0) – грамматика, в которой нет ограничений на правила вывода (то есть в правиле вывода f\to g, f и g – любые).

Грамматика типа 1 (G–1) – грамматика, в которой содержатся правила f\to g вида f = f_{1}nf_{2}, g=f_{1}wf_{2}, где n – нетерминальный символ (n\in N), f1 , f2 , w – цепочки из словаря W.

Грамматика типа 2 (G–2) – грамматика, в которой допустимы лишь правила вида n\to w, n\in N, w\in W.

Грамматика типа 3 (G–3) имеет правила вида n\to aс, либо n\to b, где n, с\in N; a, b\in T.

Грамматики типа G–0 называются свободными, типа G–1 – контекстно-зависимыми, типа G–2 – контекстно-свободными, типа G–3 – регулярными или автоматными.

-

Первые ЭВМ поставлялись без программного обеспечения, и программисту приходилось описывать в программе все необходимое для ее работы. Разработка первых алгоритмических языков (например ForTran) упростила программирование, увеличила число людей, решающих на компьютере свои задачи без привлечения программистов, положила начало двум основным направлениям в программировании: прикладному и системному программированию, а затем и третьему – инструментальному программированию.

Прикладной программист (обычно на языках программирования высокого уровня) разрабатывает программы решения конкретных естественнонаучных задач.

Системный программист (обычно на языках программирования низкого уровня) разрабатывает программы автоматизации процесса написания и отладки прикладных программ, распределения ресурсов между прикладными программами, управления процессом прохождения таких прикладных программ на ЭВМ, например разрабатывает ОС.

Язык считается тем более высокого уровня, чем более он близок к языку естественному, и считается тем более низкого уровня, чем он ближе к языкам, реализуемым аппаратно, машинным.

Формальные языки

Естевственные языки

 
tema/jazyki_estestvennogo_i_iskusstvennogo_proisxozhdenija.txt · Последние изменения: 2009/01/25 13:45 От popka_durak
 
За исключением случаев, когда указано иное, содержимое этой вики предоставляется на условиях следующей лицензии:CC Attribution-Noncommercial-Share Alike 3.0 Unported
Recent changes RSS feed Donate Powered by PHP Valid XHTML 1.0 Valid CSS Driven by DokuWiki