Стадии обработки языкаОбщая схема о

Стадии обработки языка
Общая схема обработки текстов инвариантна по отношению к выбору естественного языка. Независимо от того, на каком языке написан исходный текст, его анализ проходит одни и те же стадии. Первые две стадии (разбиение текста на отдельные предложения и на слова) практически одинаковы для большинства естественных языков. Единственное, где могут проявиться специфичные для выбранного языка черты, - это обработка сокращений слов и обработка знаков препинания (точнее, определение того, какие из знаков препинания являются концом предложения, а какие нет).
Последующие две стадии (определение характеристик отдельных слов и синтаксический анализ), напротив, сильно зависят от выбранного естественного языка. Последняя стадия (семантический анализ) также мало зависит от выбранного языка, но это проявляется только в общих подходах к проведению анализа.

Итак, любой вид машинной обработки естественного языка сообщений включает в себя обработку отдельных лексических единиц. В свою очередь, обработка отдельных слов — обработка составляющих слово частей: корня и аффиксальных частей. Структура подсистемы семантической обработки естественно-языковых сообщений может быть представлена в виде:
1. Модель текста
2. Модель фразы (группы слов)
3. Модель словосочетания (пары слов)
4. Модель слова
а) модель аффиксов
b) модель корня
Структура системы автоматизированной обработки естественного языка продиктована структурой смысла текста, ибо любой текст расчленяет на части именно смысл. Само слово, к примеру, нерасчленимо на части и именно смысл элементарных морфов позволяет выделить в нем минимальные значимые единицы.

Естественный язык представлен, с точки зрения морфологии, одноморфными и многоморфными словами. С точки зрения словообразования одноморфные слова это — непроизводные лексические единицы, многоморфные - производные. Семантика производного слова опирается, как правило, на смысл непроизводной лексической единицы, входящей в состав этого слова, и семантику аффиксального окружения (префиксы, суффиксы). Иными словами, смысл производного слова исходит из семантики морфов, входящих в состав производного слова, поэтому естественной частью модели языка является модель его словообразовательного уровня.

Итак, любой вид машинной обработки естественного языка сообщений включает в себя обработку отдельных лексических единиц. В свою очередь, обработка отдельных слов — обработка составляющих слово частей: корня и аффиксальных частей. Структура подсистемы семантической обработки естественно-языковых сообщений может быть представлена в виде:
1. Модель текста
2. Модель фразы (группы слов)
3. Модель словосочетания (пары слов)
4. Модель слова
 а) модель аффиксов
 b) модель корня
Структура системы автоматизированной обработки естественного языка продиктована структурой смысла текста, ибо любой текст расчленяет на части именно смысл. Само слово, к примеру, нерасчленимо на части и именно смысл элементарных морфов позволяет выделить в нем минимальные значимые единицы.

Естественный язык представлен, с точки зрения морфологии, одноморфными и многоморфными словами. С точки зрения словообразования одноморфные слова это — непроизводные лексические единицы, многоморфные - производные. Семантика производного слова опирается, как правило, на смысл непроизводной лексической единицы, входящей в состав этого слова, и семантику аффиксального окружения (префиксы, суффиксы). Иными словами, смысл производного слова исходит из семантики морфов, входящих в состав производного слова, поэтому естественной частью модели языка является модель его словообразовательного уровня.

0/5000

Источник: -

Цель: -

Результаты (китайский) 1: [копия]

Скопировано!

语言处理阶段文字处理的总体方案是对自然语言的选择不变。无论什么语言写的原始文本，他分析经历了相同的阶段。（将文本拆分成单独的建议和字）的前两个阶段是几乎完全相同，对于大多数的自然语言。唯一可能出现的语言特定的功能，处理缩写文字和标点处理（更确切地说，来确定的标点符号的结束句，和什么不是）。接下来两个阶段（单个词语和句法分析表征），相比之下，取决于所选的自然语言。最后阶段（语义分析）也是有点取决于语言，但它体现本身只是在分析的一般方法。因此，任何一种自然语言信息的加工包括个别词汇单位的处理。反过来，个人词语处理处理组件中的单词部分︰根和 affiksal′nyh 的部分。子系统的系统结构语义处理自然语言的消息可以表示为︰1.文本模型2.模型短语（词组）3.示范词组（双字）4.示范单词和词缀）b）模型根自动化的自然语言处理的系统结构由结构的文本的意义，因为任何文本片段成碎片具有的意义。这个词本身，例如，nerasčlenimo 的一部分，这就是意义上的基本变形它分配最小的意义单位。以形态、 odnomorfnymi 和 mnogomorfnymi，表示自然语言。从词形成 odnomorfnye 角度来看的话这是 mnogomorfnye 导出非衍生词汇单位。词派生的语义一般依赖于 neproizvodnoj 词汇单位，是单词的一部分和语义的 affiksal′nogo 环境（前缀、后缀）的含义。换句话说，意思是来自这变种，形成部分派生的单词，所以自然语言模型的一部分是其 slovoobrazovatel′nogo 水平模型的语义派生的的话。

переводится, пожалуйста, подождите..

Результаты (китайский) 2:[копия]

Скопировано!

语言处理级
一般文本处理电路是不变相对于自然语言的选择。无论哪种语言编写的源代码，其分析也采用相同的阶段。前两个步骤（文字成单个句子和单词的分解）几乎为广大自然语言的相同。可能发生特定于所选的语言特性的唯一事情-是标点符号的单词和处理的缩写的处理（或更精确地说，以确定哪些标点符号是要约的结束，这是不）。
在接下来的两个阶段（定义的个别单词的特征和解析），相比之下，在很大程度上取决于自然语言。最后一个阶段（语义分析）也略有依赖于所选择的语言，但它表现只是在一般方法的执行分析。所以，任何一种自然语言信息的计算机处理包括处理单个词汇单元。反过来，个别单词的处理-文字处理组件部分：根和贴部分。自然语言子系统消息可以如下表示的语义处理的结构：1。示范文本2。模型的短语（字组）3。型号短语（字对）4。模型字一个）词缀模型根b）示范的系统的结构，以通过的文本的意义的结构所决定的自然语言的自动处理，对于任何文本分成份它的意思。词本身，例如，在不可分割的一部分，初级顶点变形的含义允许它分配最小有意义的单位。自然语言在形态学方面和odnomorfnymi mnogomorfnymi词语呈现。从构词odnomorfnye字的视角-衍生词项mnogomorfnye -衍生物。字衍生物的语义是基于，作为一项规则，对非衍生词汇单元的意义，这是这个词和语义固定环境（前缀，后缀）的一部分。换句话说，这个词的意思是来自衍生物语义变种是一个派生词的一部分，因此，语言模型的一个自然部分是它的构词级别的模型。

переводится, пожалуйста, подождите..

Результаты (китайский) 3:[копия]

Скопировано!

预处理阶段的语言不变的总体方案相对于文本处理自然语言的选择。无论什么语言写的，它的源文本的分析，通过相同的阶段。（在前两个阶段的划分和对个别句子正确的话）为大多数自然语言几乎是相同的。唯一能体现地方特征的特定于所选语言的缩写，是处理单词和标点符号的处理（更准确地说，确定哪些从标点符号的建议是结局的，而哪些没有）。随后的两个阶段（个别单词和句法分析的定义、特点），相反，强烈地依赖于所选择的自然语言。（语义分析的最后阶段取决于所选语言）也少，但这只有在共同的态度的表现进行分析。因此，任何一种机器自然语言处理消息包括处理个别词汇单位。反过来，单个词的处理：处理аффиксальных本构字部件和零件的根。自然语言的语义结构子系统可以处理的形式提供的消息：1。的模型是正确的2。新型的短语（词组）3。新型的搭配（双字）4。新型的话（a）模型аффиксов（b）模型的根自动化的自然语言处理系统的结构由结构的解剖文本的意义，因为正是在部分的任何文本的意义。这个词本身，例如，在精确的意义和基本нерасчленимо部分морфов允许分配它最小的有意义的单位。介绍了自然语言，从形态学的角度，одноморфными和многоморфными的话。одноморфные词的构词的角度是непроизводные词汇单位，многоморфные衍生物。衍生词的语义的基础上，непроизводной通常意义的词汇单位组成的，这个词的传入和语义环境，аффиксального（前缀，后缀）。换句话说，морфов衍生词的意义来自于语义的衍生词，组成，所以他是自然的一部分словообразовательного模型语言模型的水平。

переводится, пожалуйста, подождите..

Другие языки

Поддержка инструмент перевода: Клингонский (pIqaD), Определить язык, азербайджанский, албанский, амхарский, английский, арабский, армянский, африкаанс, баскский, белорусский, бенгальский, бирманский, болгарский, боснийский, валлийский, венгерский, вьетнамский, гавайский, галисийский, греческий, грузинский, гуджарати, датский, зулу, иврит, игбо, идиш, индонезийский, ирландский, исландский, испанский, итальянский, йоруба, казахский, каннада, каталанский, киргизский, китайский, китайский традиционный, корейский, корсиканский, креольский (Гаити), курманджи, кхмерский, кхоса, лаосский, латинский, латышский, литовский, люксембургский, македонский, малагасийский, малайский, малаялам, мальтийский, маори, маратхи, монгольский, немецкий, непальский, нидерландский, норвежский, ория, панджаби, персидский, польский, португальский, пушту, руанда, румынский, русский, самоанский, себуанский, сербский, сесото, сингальский, синдхи, словацкий, словенский, сомалийский, суахили, суданский, таджикский, тайский, тамильский, татарский, телугу, турецкий, туркменский, узбекский, уйгурский, украинский, урду, филиппинский, финский, французский, фризский, хауса, хинди, хмонг, хорватский, чева, чешский, шведский, шона, шотландский (гэльский), эсперанто, эстонский, яванский, японский, Язык перевода.