동의어 사전 기능. 시소러스. 언어 매복은 동의어 사전을 유도합니다. 동의어 사전의 의미

vikoristannі에서 간단한 Razdіl duzhe. 제안된 필드에서는 필요한 단어를 입력하면 충분하며 그 의미 목록을 볼 수 있습니다. 우리 사이트는 백과 사전, tlumachny, 단어 생성 사전과 같은 다양한 gerels의 데이터를 제공한다는 점을 지적하고 싶습니다. 그래서 여기에 당신이 입력한 단어를 생활의 엉덩이에서 배울 수 있습니다.

동의어 사전의 의미

크로스워드 사전의 동의어 사전

Tlumachny 러시아어 어휘. S.I.Ozhegov, N.Yu Shvedova.

시소러스

[te], -a, m.(특수).

    모든 요가 어휘를 다시 방문하는 작업을 설정하는 언어 용어집.

    용어집 또는 zvedennya danikh, scho povnіstyu ohoplyuє termіnі, yakіy-n. 특별한 갤러리.

    닷. 동의어 사전, -a, -a.

새로운 Tlumach-러시아어 단어 생성 사전, T. F. Efremov.

시소러스

    Yakogo의 용어집 l. 요가 어휘를 최대한 표현합니다.

    yaki-l에 대한 데이터 수집의 최신 체계화. 사람들이 자신의 방향(정보에서)에서 기계를 세는 것을 허용하는 지식 영역.

백과 사전, 1998

시소러스

시소러스(그리스어 시소러스의 유형 - 소지품)

    텍스트에 살아있는 엉덩이가있는 mov의 단어가 가능한 한 완전히 표현되는 사전입니다 (obsyazy의 경우 죽은 mov보다 적습니다).

    용어집은 일종의 지식이라고 볼 수 있는 단어의 방식으로 주제 원리에 따라 정렬되고 어휘 단위 사이에 의미 블루스(속별, 동의어 및 in)를 표시합니다. 단어별 정보 시소러스에서 텍스트의 어휘 단위는 설명자로 대체됩니다.

시소러스

(그리스 테소로스 ≈ 보물, 재무부에서 유래) 주어진 시맨틱 보드노신 시스템에서 단일 행동을 비인격적으로 관능적으로 표현합니다. T.는 실제로 영화의 의미론을 정의한다(국민 영화, 특정 과학 영화 및 자동화 제어 시스템을 위한 형식화된 영화). T.의 머리는 의미론적 단어가 주제별 표제 뒤의 단어 그룹에 할당되는 단일 용어 어휘처럼 보였습니다. 예를 들어, English T.(저자 P. M. Roget), 1962년 목격(1852년 첫 목격), 1040개의 표제, 거의 240,000단어가 주어졌습니다. Vkazіvnik (키)에서 tsgogo Т로. 영어, 프랑스어 및 스페인어에 대한 전통적인 언어 언어(다른 언어의 의미 체계 인벤토리)를 설정합니다. T. 는 예를 들어 러시아 S. I. 사전과 같이 피부 단어의 주요 의미 매개 변수의 정의를 설정하는 한 단어 사전에 가깝습니다. Ozhegov.

70년대에. 20일 nabuli는 informational-poshukovo T를 넓혔습니다. T. cich.에서는 문서 정보를 자동으로 검색 할 수있는 설명자 인 특수 어휘 단위가 보였습니다. 그러한 언어의 스킨 워드로 동의어 설명자 (div. 동의어)가 설정되고 설명자의 경우 의미 론적 비문이 명시 적으로 표시됩니다 : рід - 종, 부분 - qile, meta - zasіb 등 연관 기호 . 따라서 피부 설명자에 대한 SRSR 1973의 비전인 "Information-by-sound thesaurus of informatics"는 동의어 키워드, 성별, 종 및 연관 설명자를 나타내는 사전 기사, de ocremo를 전송합니다. 설명자 간의 연관 링크에 대한 간략한 방향을 위해 첫 번째 T까지 주제별 클래스의 시맨틱 맵이 적용됩니다. 자동화된 정보 검색을 통해 문서가 검색되며, 여기서 색인은 설명자 이상이 아니라 설명자이기도 합니다. 마치 동일한 의미론적 컨텍스트에서 문서가 검색되는 것처럼 말입니다. 즉, 질병 - 모닝콜, 첨부 파일 - 인식 (또는 변수 값) 등이 주제 영역에 특정한 T. 특정 연관 단어를 볼 수 있습니다. 전체 단어를 입력할 수 있는 의미론적 단어 체계에 대한 지식(zocrema 및 rubrics, 입력할 위치)을 통해 단어의 의미에 대해 쓸 수 있습니다.

넓은 의미의 T. 는 마치 개인 정보 또는 사람들의 그룹을 가질 수 있는 것처럼 현실에 대한 지식 시스템에 대한 설명으로 해석합니다. Tsej nosіy는 vikonuvaty 기능 priymacha dodatkovoї _іnformatsії, zamіnyuєє 그 yogo Т 후에 할 수 있습니다. 심리학에서, 그리고 지능의 일부를 가진 시스템의 발달로 그들은 그 감각적인 정보를 받았을 때 나타나는 T. 개인의 힘을 봅니다. 사회학 및 커뮤니케이션 이론에서 T. 개인 및 집단의 힘이 개발되어 T. 'Language, scho vyznachayut stock vіdomosti, yakі mає 접이식 시스템의 일관성을 기반으로 이해 가능성을 보장합니다. T. 활동에 대한 정보로서 실제로 복수하고, 새로운 정보를 받을 가능성을 보장하는 메타정보(information about information).

Chorniy A.I., 자갈나 기법동의어 사전, “과학적 및 기술 정보. Ser. 2", 1968, ╧5; Varga D., 정보 시소러스 준비 방법론, prov. [Z Hung.], M., 1970; Shreider Yu.A., 정보학 및 이론적 의미론의 시소러스, “과학적 및 기술 정보. Ser. 2", 1971, ╧ Z.

Yu. A. Schreider.

위키백과

시소러스

시소러스, V 센시- 특수 용어, 더 엄밀히 말하면 동일한 주제 - 사전, 정보 수집, 이해와 유사한 말뭉치 또는 이름, 특정 갤러리 지식 또는 활동 영역에서 해당 용어의 지정, 올바른 것을 받아 들일 수 있음 어휘, 공동 친교 katsii; 현대 언어학에는 어휘 단위 사이에 의미 관용구(동의어, 반의어, 동의어, 하위어, 상위어 toshcho)가 있는 특별한 변형 유형의 사전이 있습니다. 동의어 사전은 네 가지 주제 영역을 설명하는 두 가지 도구 중 하나입니다.

어두운 어휘의 관점에서 동의어 사전은 추가 도움으로 의미를 드러내고 해당 요고 그룹의 다른 이해와 함께 이해해야 할 단어의 관점에서 지식의 기반을 강조할 수 있습니다. 통신의 시스템입니다.

지난 학기 기준 시소러스최대한의 완전성을 가진 텍스트에 사는 버트와 її로 언어의 어휘를 나타내는 사전이 중요했습니다.

같은 용어 시소러스 Vykoristovuєtsya 이론적으로 іnformatsії znachennja sukupnostі vsіh vіdomosti, yakim maє 주제.

심리학에서 개인의 동의어 사전은 해당 논리적 정보의 인식을 특징짓습니다. 커뮤니케이션 이론은 이러한 요소들과의 상호 작용을 가능하게 하는 폴딩 시스템의 깊은 동의어 사전도 살펴봅니다.

시소러스(값)

시소러스:

  • Thesaurus는 사전, 이해할 수 있는 정보 모음, 즉 활동 영역에 대한 특별한 지식을 나타내는 용어입니다.
  • Roger의 시소러스는 역사상 최초이자 오늘날의 표의 사전에서 가장 큰 사전 중 하나입니다.

시소러스라는 단어를 문학에 적용합니다.

sprynyattya의 경우 spіvtvorchostі nebhіdnіy yakiys 최적 시소러스, 말리도 아니고 에일도 아니고 너무 크지도 않습니다.

찾을 수 있는 많은 양의 정보에 둘러싸여 있지 않을 때 나는 완전히 다시 방문합니다. 시소러스. 시소러스옴.

독창성 채택의 불균일성을 순식간에 가져 오는 예술의 풍부함, 체계적 특성 : 구절의 일부 측면 채택 시소러스타인을 위한 최적의 것-부족하거나 위대한 것.

그래서 야크 시소러스성장하고 변화하는 창조물과의 재동일화는 새로운 가치 있는 정보의 제거를 의미할 수 있습니다.

Pragnennya child Bagatoraz는 이야기를 현명하게 다시 읽습니다. 시소러스 Shvidko zrostaє는 spіvtvorchostі까지 її zdatnіst, 연관 환상까지 특히 좋습니다.

이 쪽은 더 미묘하고 주관적이며 더 낮습니다. 시소러스, 객관적인 미적 평가를 찾기 위해 최소한으로 만들 수 있습니다.

와인이 침투하다 시소러스시 및 주소 번역 시소러스 inshomonic 독자에서.

schob은 당신의 것이 얼마나 위대한지를 의미합니다. 시소러스, 티.

Nі, 그냥 yogo vlasny 수하물-비참한, vin 비 비난, yogo 시소러스배아 상태에서 알고 있으며 이해하지 못하더라도 시소러스 buti zbіlshenii의 유죄, prinaimnі tsіy zhіntsі z 그것은 나쁜 일이 발생합니다.

바가티 시소러스, 참된 지식에 기초하여 가장 가까운 사람과의 가장 가까운 접촉을 포함하여 다른 사람과 접촉하는 사람들이 일어나지 않을 모든 것에 올바르게 반응할 수 있도록 합니다.

성장에 대한 정보의 가치 하락은 명백합니다. 시소러스입금될 수 있습니다 시소러스빼앗긴 정보의 양만큼.

예술적 정보의 최적가치는 근접성에 기반을 두고 있음은 자명하다. 시소러스그 치타차 시소러스시인.

창의성과 유사한 spivtvorchist는 시소러스의미상.

뻔한 것의 경계에서 맴도는 밝은 조형성과 밝은 울림의 내적 반복 시소러스, zagachuє yogo tim 반복 할 가장 미적 순간.

누구의 요점? 시소러스 Plato의 요구 사항의 대립은 Nabokov와 Prishvin을 존중하는 것이며 우리가 같다면 Marina Tsvetaeva를 인정할 수 있습니다.

N. V. 루카셰비치

[이메일 보호]

B. V. 도브로프

모스크바 주립 대학의 과학 및 연구 센터 im. M.V.로모노소프;

ANO 정보 연구 센터

[이메일 보호]

키워드:동의어 사전, 정보 검색, 자동 텍스트 처리,

더 중요한 것은 통계적 방법과 상상적 방법을 기반으로 방대한 텍스트 컬렉션에 사용되는 기술입니다. 추가적인 언어학적 방법을 사용하여 텍스트 컬렉션을 처리하기 위해 분류될 수 있는 어휘 리소스는 수만 개의 어휘 기사와 여러 중요한 권위를 담당하므로 자원 . 또한 RuThez 텍스트의 컴퓨터 처리를 위해 1997년부터 생성된 러시아어 시소러스를 기반으로 훌륭한 텍스트 컬렉션의 자동 처리를 위한 어휘 리소스 개발의 주요 원칙을 고려합니다. 42,000 이상을 이해해야합니다. 우리는 어휘 창고의 구성과 러시아 대학 정보 시스템(www.cir.ru)의 텍스트 코퍼스 - 400,000개의 문서를 기반으로 시소러스의 현재 상태를 설명합니다. 자동 텍스트 처리를 위한 다양한 프로그램에서 동의어 사전의 적용에 대해 논의합니다.

  1. 기입

수백만 개의 문서가 전자 형식으로 제공되고 수천 개의 정보 시스템과 전자 라이브러리가 생성되었습니다. 이 정보 시스템에서 어휘 및 용어 자원은 빈번한 간격으로 계산됩니다. 현재 수집된 전자 문서의 자동 처리를 위한 언어 자원의 생성에는 심각한 문제가 있습니다.

우선, tsі 컬렉션은 훨씬 더 크게 들리며 리소스는 수천 개의 단어와 용어 목록에 대한 복수의 책임이 있습니다. 다른 방식으로, 컬렉션은 텍스트에 대한 자동 워드 프로세싱을 더 쉽게 만드는 다양한 구문 구성을 가진 다양한 구조의 문서 집합입니다. 게다가 자주 중요한 정보 rozpodіleno mizh raznimi rechennyami 텍스트.

마찬가지로 언어 자원에 대해 유죄 인 사람들에 대한 음식을 넣는 것이 중요합니다. 한쪽에서는 전자 컬렉션에서 검색을 자동 처리하는 동안 수정되고 다른 쪽에서는 한 시간 동안 생성되는 순간이 수정됩니다 검사 가능 라미.

이 기사에서는 훌륭한 텍스트 컬렉션의 자동 처리를 위한 어휘 리소스 개발의 주요 원칙을 살펴볼 것입니다. 이러한 원칙은 RuThez 텍스트의 컴퓨터 처리를 위해 1997년 ANO 정보 연구 센터에서 만든 러시아어 동의어 사전을 기반으로 검토됩니다. RuTes는 시간에 iєarkhіchnu mezhu ponad 42 tysyach를 이해하고, scho는 재고 ponіd 95 tysyach 러시아어 단어, 단어, 용어를 포함합니다. 우리는 NDVC MDU im이 지원하는 RUSSIA 대학 정보 시스템의 텍스트 코퍼스의 어휘 창고와 어휘를 기반으로 시소러스의 현재 상태를 설명합니다. MV Lomonosov 및 ANO TsII. UIS RUSSIA(www.cir.ru)는 서스펜스-정치적 주제에 관한 400,000개의 문서를 수집합니다(약 3GB의 텍스트, 2억 단어). 이 기사에서는 자동 텍스트 처리를 위한 다른 프로그램의 동의어 사전 예제도 살펴볼 것입니다.

  1. 언어 자원 개발의 원칙

정보 검색 책임자

전자 문서의 효율적인 자동 처리(자동 인덱싱, 루브리케이션, 문서 정렬)를 보장하려면 문서에서 추측한 내용의 목록인 일치 기준을 유도해야 합니다. 이러한 색인이 더 효과적이고 낮은 용어가 되려면 동의어, 풍부한 의미, 언어의 일부, 문체와 같은 텍스트의 어휘 다양성을 개선하고 불변으로 가져 오는 것이 필요합니다. 기본이되므로 이해하십시오. 다양한 텍스트의 공식화를 위해 . 이제부터 언어 자원의 기초는 이해이고 말의 언어(단어, 용어)는 이해의 초기화와 같이 텍스트 입력 이상의 것이 됩니다.

차이점을 이해하기 위해 에일은 이해의 빛 뒤에 가깝고 그들을 돕기 위해 파란색으로 설치할 수 있습니다. 전통적으로 자연어로 된 텍스트의 자동 처리를 위한 언어 자원에는 다음과 같은 다른 의미론적 단어 세트가 있었습니다. 부품, dzherelo, 이유등. 그러나 수집된 텍스트의 종류가 매우 많기 때문에 가장 낮은 수준의 텍스트 처리 기술로는 컴퓨터 시스템이 텍스트에 파란색을 안정적으로 표시하지 못하여 다른 사람들과 티미로 묶여 있다는 것을 이해하고 있습니다. 그러므로 처음부터 불변의 권위가 거짓말을 하거나 약하게 거짓말을 하는 것이 아니라면 어떻게 설명하는지 이해하는 것이 분명합니다. 특정 텍스트, 누가 이해했는지 추측했습니다.

이러한 입력의 주요 기능은 전원 공급 장치를 확인하는 것입니다.

보시다시피 할당 텍스트는 C1 및 C2 바인딩에 대해 설명합니다.

환경아르 자형s C1, 텍스트의 주제가 무엇인지 어떻게 말할 수 있습니까?(*)

C2로 확장할 수 있습니까?

p align="justify"> 자동 처리를 위해 언어 자원을 정렬할 때 C1과 C2 사이의 의미(*)에서 이해력이 올바르게 설정될 수 있는지 정렬하는 것이 중요합니다.

예를 들어 텍스트가 작성되지 않은 경우 자작 나무,우리는 항상 텍스트가 무엇인지 말할 수 있습니다 나무.에일, vіdnosin에 대한 빈번한 토론의 인기에 관계없이 나무야크 부분 여우, 나무에 대한 텍스트와 여우에 대한 텍스트의 수는 이미 미미합니다. 중요한 것은 문제가 확장 이름과 관련이 없다는 것입니다. 그래서 prosіka - 숲의 tse 부분, 나는 prosіks에 대한 텍스트 lіs에 대한 텍스트입니다.

의미있는 세계의 주제 영역에서 텍스트의 가능한 주제의 스펙트럼 측면에서 불변성은 더 심오한 힘, 단어의 이름으로 표현되는 낮은 힘으로 특징 지어지며 그 실존 적 힘으로 정량화됩니다. 따라서 vіdnosin의 힘의 정량자는 엉덩이의 수명주기를 늘려서 설명합니다. vikoristannyam vіdnosini의 문제 나무리스그 자체와 po'yazana z tim, scho는 숲의 특정 나무 znahoditsya가 아니라 prote prosіka는 숲을 포즈를 취할 수 없습니다.

vіdnosin의 실존 적 힘에 대한 설명의 예 - chi z іsnuvannya pontificatya C1 іsnuvannya pontificatya C2 차고이해하는 데 도움 자동차) 또는 버트 C1의 기초는 버트 C2의 기초 형태로 증착되어야 합니다(따라서 특정 홍수부적절한 유형의 특정 엉덩이 리키). 휴경지 개념 C2, 특히 엉덩이로서의 휴경지 개념에 대한 텍스트의 논의를 통해 텍스트가 머리 개념 C1을 의미한다는 것을 인정할 수 있습니다.

이해자들 사이의 비전을 살펴보자 폭스 아이 트리자세한 내용은. 정말 부분적으로 이해합니다 리스є 폭스 인 더 폭스, 그 시간에 아는 방법 높은 스탠딩 우드,정원의 나무 ta іn 젊은 사람이 이해의 순서를 이해하는 것이 필요합니다 나무이해하다 리스.

다른 쪽에서, 리스보다 나무 구입, 나무 없이 사용하지 마십시오(뿐만 아니라 정원). 이와 같이 이해 리스보일 수 있습니다 나무. 특정 응용 작업의 요구 분석에서 시작하여 텍스트의 깊은 힘을 설명하는 것의 중요성에 대해 논의했습니다. 훌륭한 텍스트 컬렉션의 처리, 그리고 아마도 다른 노동자들의 부유함을 위해.

한 번에 모델은 Higher-lower(모든 링크의 66%), part-tsile(링크의 30%), 연관(4%), 유사한 첨가제 수정자 세트( 2). 의미심장하게도 PART-CELEBRATION 및 ASOCIATSІYA에서 볼 수 있는 것은 규칙(*)의 개선으로 해석됩니다. 이해자 간의 거의 160,000개의 직접 호출이 설명되어 있으며, 음성의 전이성 개선으로 인해 1350,000개 이상의 호출을 제공하며 평균 피부 30명의 다른 사용자가 이해할 수 있습니다.

  1. Thesaurus RuThes: 암호 구조

Thesaurus RuThez є ієєєєrkhіchіchnoj razrezhі 이해하려면 scho vіdvіdat okremih slіv의 의미, 텍스트 vrazіv аbo sіnоnіmіchіnі 순위. 그런 다음 시소러스의 주요 요소는 이해, 단어 이동, 표현 보기 및 이동 - 이해, 이해 사이 파란색 보기입니다.

동의어 사전에서는 전통적으로 어휘, 의미 론적 지식으로 간주되는 어휘, 관용구 및 해당 연결에 대한 설명과 주제 영역 중간의 용어 및 상호 관계에 대한 지식, 전통 이노와 같은 언어 지식으로 단일 시스템이 선택됩니다. 정보 및 검색 초록에 설명된 용어 활동 영역에 대한 vodnosyasya. 시소러스의 이러한 주제 영역은 경제, 법률, 금융, 인터내셔널 블루, 바닥재는 중요합니다 일상 생활악취가 나는 사람들은 전통적인 우울한 사전에서 더 많은 어휘 표현을 의미할 수 있습니다. 악취는 어휘적이고 용어적으로 강하게 상호 관련되어 서로 관련되어 있습니다.

Movnimi vyslovlyuvannya є okremі lexemes (menniks, prikmetniki 및 dієslova), іmennі 및 dієslіvnі 그룹. 이와 같이 시소러스는 형용사와 서비스어의 현대어를 어떻게 동시에 포함하지 않는다. 단어가 풍부한 그룹의 창고에는 용어, 숙어, 어휘 기능( 밀어 넣다이자형).

피부 세척의 경우 Virase는 다음과 같이 설명됩니다.

이 풍부한 의미는 하나 이상의 이해와의 연결이며, 이는 주어진 현대 언어가 해당 이해를 위한 텍스트 언어로 사용될 수 있음을 의미합니다. rіznih에 대한 현대 표현의 도입은 풍부한 의미에 대한 암시적인 진술로 이해되어야 합니다.

Yogo 형태학 창고 (영화의 일부, 번호, vіdminok);

글쓰기의 특성(예를 들어, 큰 편지에서)은 빈약합니다.

피부로 이해할 수 있는 시소러스는 고유한 이름, 텍스트로 표현할 수 있는 현재 단어 목록, 기타 이해할 수 있는 단어 목록을 가질 수 있습니다.

고유한 이름으로 이해할 수 있는 소리는 요고의 명확한 텍스트 표현 중 하나입니다. 그러나 이해의 이름은 한 쌍의 모호한 텍스트 구절, 즉 고유하게 원시적인 누군가를 통해 기록된 동의어(예: 이해 토브스티, 정원). 모호한 텍스트 viraz 이름 이해, 아마도 보안 마지막 또는 흐려짐의 단축된 조각, 예를 들어 이해 NABOV(인종 집단).

  1. 어휘 기사의 예

Mi는 Slovnikov의 이해 조항에 엉덩이처럼 진동했습니다. 폭스 매시브, 단어의 의미 중 하나를 보여줍니다. 리스. Tsya slovnikova 기사 cіkava tim은 전통적으로 어휘(의미론) 지식과 백과사전 지식(주제 영역에 대한 지식, 용어)을 지칭하기 때문에 다양한 유형의 지식을 포함합니다.

이해해야 할 동의어 폭스 매시브(총 13개):

리스(), 삼림 지대, 여우 중간,

숲, 숲 분기, 숲 풍경,

숲 지구, lisok, lisopokrity,

숲 지구,

숲의 배열.

동의어로 이해하기:

밀림(밀림);

리소파크(마이스카이 가든, 녹지,

녹색 대산 괴, 삼림 공원,

삼림 공원 주, 삼림 공원 주

벨트, 공원), 공원 구역);

LISOMISLIVSKOE 주;

여우 잎(부드러운 잎, 딱딱한 잎

리스);

남자(디브로바);

CONFINERY FOX(침엽수 배열, 암침엽수)

동의어의 이해 부분:

BURELOM(부렐롬니, 비루바브);

비롭카(여우);

리소바 문화(여우 품종, 여우 품종

문화);

LISSOVI EARTH (삼림 기금의 토지, 토지, vkriti

여우; 산림 지역, 산림 지역;

숲 덮개, 숲 덮개

영역,);

리슨 플랜트(산림 재배지, 산림 재배지,

삼림 심기);

모두 다 아는(매듭, 테두리);

피들리속);

프로시카;

마른(마른).

여기서 기호(M)는 텍스트 입력의 풍부함을 나타내는 기호를 나타냅니다.

개념 폭스 매시브다른 블루스일 수도 있으므로 휴경지의 이름(현재 버전은 ASC 2 - 비대칭 연결이라고 함): 리소바 포제자(lisopozhzhna, lisi의 pozhezha; 리소코리스탄냐 (산림 koristuvannya, 산림 기금에 의한 koristuvannya); 리솔라단냐; 리소바 사이언스 (숲에 관한 과학). 포인트 2에서 지적한 바와 같이, FOREST에 대한 이해는 WOOD에 대한 이해에 있으며, Thesaurus는 ASC 1의 설정에 할당됩니다.

이해하기 쉬운 폭스 매시브 235개의 컨셉(총 650개 이상의 텍스트 입력)으로 비주얼의 전이성을 개선하여 다른 28개의 컨셉과 중간 없이 연결됩니다.

  1. 현재 상태 추정

러시아 영화 RuThez의 시소러스

5.1. 어휘 창고

동의어 사전 라인에는 61,000개의 한 단어를 포함하여 95,000개가 넘는 현대 관용구가 있습니다.

그 언어의 단어가 Thesaurus의 설명 앞에 포함되어야 하기 때문에 그러한 부서진 마음의 obsyag가 우리에게 지정되었습니다. 천연 바잔은 놀랐습니다. 빈도 단어러시아어. Vikoristan의 이 대로에 대해 우크라이나 대학 정보 시스템(400,000개의 문서)의 텍스트 모음입니다. 다양한 기관의 공식 문서 수집 러시아 연방(1992년의 55,000개 문서), 1999년의 언론 자료(Izvestiya, Nezalezhna Gazeta, Komsomolskaya Pravda, Argumenti ta Fakti, Expert 잡지 등의 신문), 과학 저널의 자료( "Bulletin of the Moscow University", "Sociological 신문"). 설정은 Thesaurus에 포함된 토픽 목록과 텍스트 모음에서 가장 빈도가 높은 100,000개 토픽 목록(빈도 25 이상) 사이에서 이루어졌다.

목록의 어휘 이름은 100,000에서 35,000 사이가 RuThes에 설명되어 있고 약 7,000개의 장점 어휘만 Thesaurus에 포함되어 있으며 나머지는 다양한 정부 이름의 표제어 변형임을 보여줍니다. 따라서 보충은 더 이상 우선 순위 작업이 아니며 빈도 단어부터 시작하여 단계별로 수행됩니다. yak tilki 목록, stuke vichens 목록, іnformasi 시스템의 숙달과 함께 Vikonano Chergov Porivnyann을 깨우면 주파수 bi의 생생한 lexemeh가 될 것입니다. 텍스트 컬렉션에 많은 수의 텍스트 응용 프로그램이 있으므로 "어휘적 참신함"(예: 설치,블록버스터, 보 몽드, 스릴러) 동의어 사전 보관 시스템의 관련 영역에 포함합니다.

Postiyna는 실제 텍스트 컬렉션을 사용하여 사전에 제시된 어휘 설명의 중요성과 품질을 재확인할 수 있는 고유한 기회를 제공합니다. 그래서, 예를 들어, 그것은 단어의 높은 빈도에 대해 언어상으로 드러났습니다. 페르쇼프레스톨나(400회 이상). 배열을 재검증한 결과 deysno라는 단어가 단어의 동의어로 종종 승리하는 것으로 나타났습니다. 모스크바, 합리적인 사전은 종종 old와 같은 단어를 의미하지만. 사전에서 오래된 것으로 알려진 단어의 두 번째 엉덩이는 자주 사용되는(300회 이상) 단어입니다. 친절한.

5.2 의미 설명

텍스트 모음에 대한 설명은 많은 빈도 단어가 Thesaurus에 잘 표현되어 있지만 (주요 이름) 의미 중 하나로 표시되어 있음을 보여줍니다. Z'yasuvati, Thesaurus는 우리의 첫 번째 작업에 러시아어의 풍부하고 의미있는 단어의 의미 스펙트럼을 가지고 있습니다.

보시다시피, 종종 다른 사전은 매우 의미 있는 단어에 대해 다른 의미 세트를 제공하고, 다른 의미를 볼 수 있으며, 또한 동일한 유형의 풍부한 의미가 동일한 사전의 다른 단어에 대한 다른 설명에서 찾을 수 있습니다. 따라서 어휘소의 의미를 마지막으로 대표적으로 기술하는 작업은 모든 사전 자원의 작성자에게 중요한 작업입니다.

그러나 자원이 자동 처리에 할당되면 균형 설명에 주어진 값이 중요해집니다. 전 세계적인 rozdmuhuvannya 값은 컴퓨터 시스템의 부적합 지점을 가져올 수 있으며 필요한 값을 선택하여 텍스트 자동 처리 로봇 시스템의 효율성을 크게 감소시킬 수 있습니다. 그래서 워드넷 리소스의 단점 중 하나인 텍스트 자동 처리 리소스로 그런 단어에 대해 기술된 값이 엄청나게 많다(워드넷 1.6: 53개 값에 대해). 달리다.47 놀다등). 텍스트의 의미 분석 시간 동안 사람을 구별하는 것이 중요합니다. 적절한 값을 선택하면 컴퓨터 시스템도 작동할 수 있음을 이해했습니다. 이러한 차이에 저자는 가치를 높이는 다양한 방법을 제안하고, 작품의 질을 높이기 위해 흐느끼고 있다.

동시에 다른 요소가 있습니다. 의미가 자체 어휘 링크 세트 뒤에서 해독되는 방식(우리의 경우 동의어 사전 링크) - 악취는 하나의 단위(이해할 수 있음)에 붙일 수밖에 없습니다. 이것은 동일합니다. 방법 자동 기계 개인 포장.

단어의 엉덩이를 보자 학교і 교회, 피부는 생명과 같은 조직으로 볼 수 있습니다.

여러 부스(대부분 1개)의 스킨스쿨 편성. 학교 생활의 콧수염 부분(수업, doshki)까지 학교조직에 야크. 특정 유형의 학교 주택은 많지 않습니다. 그 설명에 학교 budіvlі가 이해의 가장자리에서 nedocily로 볼 수 있습니다. 그러한 비열한 이해에 대한 단호한 설명 학교조직으로서 그리고 집으로서 어머니는 이해하기 위해 특별히 고안된 설정의 책임이 있습니다. 부디녹. 유사한 단어를 설명할 때 Thesaurus는 수정자 "A"(이 단어의 모양을 자동으로 분석하는 "aspect", 다른 단어로 "확인"해야 함)이라는 단어에 기호를 사용합니다.

학교

비슈체 조명 테두리

비쉐 A HROMADSKA BUDIVLYA

단어의 Vidpovidnі 의미 교회그렇게 가깝지 않습니다. 교회하나의 조직이 다른 장소에 있는 수많은 교회 생활의 어머니가 될 수 있을 뿐만 아니라 비인격적인 다른 삶을 살 수도 있습니다. 교회-budivlya종교 및 교파와 밀접한 관련이 있거나 소속을 다음으로 변경할 수 있습니다. 교회 조직. 교회 조직і 교회-budivlya다를 수 있습니다. 톰 교회(조직) 저것 교회(부디녹) Rutez에서 다른 이해로 자신을 소개하십시오.

시소러스 링크 사이의 차이점은 중요하지만 표시 구성, 유사한 의미 및 상호 교환 가능과 관련이 있습니다. 그래서 교회생활은 학교생활의 이름을 바꾼다고 해서 교회생활이 될 교회로 불리기를 그치지 않는다.

Thesaurus의 의미 표현을 진동시키는 과정은 가장 일반적인 lems에서 시작하여 지속적으로 수행됩니다. 표피 빈도 어휘소의 경우 암흑 사전에 의미가 설명되어 있고 컬렉션에서 의미가 발견되고 동의어 사전에 악취가 표시됨에 따라 변경됩니다. 그 결과, 주어진 시간에 10,000개의 어휘소 목록이 형성되었으며, 그 풍부함은 여전히 ​​추가 분석 또는 추가 설명이 필요합니다. 이 목록은 가장 일반적인 주파수 30,000개를 기반으로 합니다.

시소러스에서 의미의 풍부함의 문제는 단어의 서로 다른 의미 사이에서 시소러스 링크로 설명될 수 있고 이해의 계층을 위해 더 많은 홍보를 위해 선택될 수 있다는 사실을 고려하는 것으로 종종 간주된다는 점에 유의해야 합니다. . 이미 본문에서 확실히 논의되었습니다. 예를 들어, 단어 스비틀리나세 가지 의미를 가질 수 있습니다: 활동 영역으로서의 사진, 사진 기호로서의 사진, 사진 스튜디오로서의 사진:

사진 촬영(촬영, 사진 오른쪽, ..., 스비틀리나 )

차스티나 사진 이미지

(사진, 사진술, 스비틀리나 )

차스티나 포토쉘터 (스비틀리나 ).

그런 순위에서 의미있는 단어로 성장할 수없는 것처럼 스비틀리나, 이해를 돕기 위해 사진 캡처 (프로세스, 결과 또는 장소)에 대해 말한 내용, 풍부한 텍스트 자동 처리 프로그램에 충분합니다.

  1. Zastosuvannya 동의어 사전 Ruthez

텍스트 자동 처리

1995년부터 Suspіlno-politična terminologiya RuTes(커뮤니티-정치 시소러스)는 자동 개념 색인, 다양한 데칼 루브리케이터를 사용한 자동 윤활, 영어를 포함한 자동 주석 텍스트와 같은 텍스트 자동 처리를 위한 다양한 프로그램을 위해 활발하고 성공적으로 개발되었습니다. 그들.. Suspile-political thesaurus(이해할 수 있는 27,000개, 텍스트 입력 62,000개)는 UIS RUSSIA(www.cir.ru)의 검색 시스템을 위한 기본 검색 도구입니다.

접을 수 있는 계층적 루브리케이터에 대한 텍스트의 자동 루브리케이팅 절차에서 RuThes 시소러스의 전체 어휘를 ​​뺍니다. 기본 기술에서는 스킨 표제를 부울(Boolean) 다양한 용어로 기술한 후 시소러스의 계층 구조로 시각적 공식의 확장을 수행할 수 있습니다. 결과 부울 비라아제는 심지어 수백, 수천 개의 접속사 및 이접사를 취할 수 있습니다.

예를 들어 분류를 위해 VTsIOM에서 선택한 SOFIST 2 루브리케이터의 "여성의 이미지"라는 제목의 시소러스 개념에 대한 설명의 일부(공식 확장 후 현대 단어 사용)를 추가합니다. 여론 교육을 위한 설문지:

(여자[N]

|| 소녀[N]

|| ODRIVNITSIA [L] (할머니, 오누카, 사촌,

딸, 시누이, 어머니, 계모, 신부, 의붓자식, ...))

(캐릭터 [L] (자비, 무자비, 건망증,

경솔한, 비웃는, 편협한, 동지, ...)

|| IMAGE[E] (선물, 잘생김,

zovn_shnist, 보기, imidzh, 보기)

|| RECEPTION [L] (..., cicavius, 아름다운, 멋진,

상냥한, 호감이 가는, 호감이 가는, ...)

|| UNPLEASANT [L] (동정적이지 않은, 무례한, 용납할 수 없는, ...)

|| VALUE [L] (축복, 숭배, 사랑,

절하다, 절하다, ...)

|| OVERVAG[N]

기호 "E"는 시소러스 계층 구조에 따른 외부 확장을 의미하고 기호 "L"은 특정 링크("LOWER") 뒤, 기호 "N"은 확장하지 않음을 의미합니다.

시소러스에 대한 지식과 기계 학습 절차를 향상시키기 위해 텍스트 자동 제목의 결합 기술 개발에 대한 추가 연구가 수행됩니다.

다음은 자연 언어로 공식화된 지식을 확장하는 시소러스의 힘입니다(동시에 UIS RUSSIA의 정보 및 검색 시스템에서 용어 지식의 확장을 위해 시소러스의 유연한 정치적 부분은 없습니다. ), 훌륭한 텍스트 컬렉션을 제공하는 아이디어.

7. 비스노보크

로봇은 훌륭한 텍스트 컬렉션의 자동 처리를 위한 언어 자원 개발의 주요 매복을 가지고 있습니다. 러시아 영화 RuThez의 시소러스(Thesaurus of the Russian Movie)의 언어 자원 생성 - 개념적 문서 인덱싱, 접을 수 있는 계층적 표제에 대한 자동 루브리케이션, 자연스럽게 움직이는 입력의 자동 확장과 같은 텍스트의 자동 처리 보충과 같은 선택을 위한 약속의 생성.

이 작업은 RDNF 부여 번호 00-04-00272a에 의해 부분적으로 지원됩니다.

문학

  1. Lukashevich N.V., Saliy A.D., 자동 텍스트 처리 시스템에 대한 지식 // NTI, Ser.2. 1997. 3호 S. 1-6.
  2. Zhuravlyov S.V., Yudina T.M., 러시아 정보 시스템 // NTI, Ser.2. 1995. 3호 S. 18-20.
  3. Winston M., Chaffin R., Herman D., 부분-전체 관계의 분류 // 인지 과학. 1987. 아니. 11. P.417-444.
  4. Priss U.E., 관계 개념 분석 방법을 통한 WordNet의 형식화 // WordNet. 전자 어휘 데이터베이스/Ed. C. 펠바움. Cambridge, Massachusetts, London, England.: The MIT Press 1998. P. 179-196.
  5. Guarino N., Welty C., 속성의 형식적 온톨로지 // 온톨로지 및 문제 해결 방법의 응용에 관한 ECAI-00 워크숍 진행. 베를린: 2000. P. 121-128. (http://citeseer.nj.nec.com/guarino00formal.html).

상위 수준 어휘 자원 설계를 위한 행위 존재론적 원리 // First Int. 회의 언어 자원 및 평가에. 1998.

  1. Lukashevich N.V., Dobrov B.V., 자동 색인 생성을 위한 동의어 사전의 개념 입력 수정자 // NTI, Ser.2. 2000년 4호, 21-28면.
  2. 러시아어 / Ed의 위대한 우울한 사전. S.A. Kuznetsov. SPb.: 노린트, 1998.
  3. Ozhegov S.I., Shvedova N.Yu., Tlumachny 러시아어 어휘 - 3판. 남: Az', 1996.
  4. Apresyan Yu.D., 선택 사례, 볼륨 I. 어휘 의미론: 2형. M: 학교 "영화 러시아 문화", Ed. 회사 "Skhidna 문학"RAS, 1995.
  5. G. Miller, R. Beckwith, C. Fellbaum, D. Gross 및 K. Miller, WordNet에 관한 5개의 논문, CSL 보고서 43. Cognitive Science Laboratory, Princeton University, 1990.
  6. Chugur, J. Gonzalo 및 F. Verdjeo, NLP 애플리케이션의 구분 구분 // "OntoLex-2000" 절차: 온톨로지 및 어휘 지식 기반. 소피아: OntoTextLab. 2000.
  7. Loukachevitch N., Dobrov B., 다국어 정보 시스템의 동의어 사전 기반 구조 주제 요약 // 기계 번역 검토. 2000호 11. P. 10-20. (http://www.bcs.org.uk/siggroup/nalatran/mtreview/mtr-11/mtr-11-8.htm).

자연어 처리를 위한 러시아어 시소러스

대규모 텍스트 컬렉션

나탈리아 V. 루카체비치, 보리스 V. 도브로프

키워드:동의어 사전, 자연스러운 현대 프로세스, 검색된 정보

우리의 검토에서 우리는 컬렉션의 위대한 텍스트의 자동 프로세스를 위한 어휘 자원 개발과 1997년부터 특별히 자동 텍스트를 위한 도구로 개발된 동의어 사전 러시아어의 구조를 해독하기 위한 주요 원칙을 고려합니다. 처리. Zaraz Thesaurus는 42,000개 개념의 계층적 네트워크입니다. 우리는 400,000개의 문서를 포함하여 University Information System RUSSIA(www.cir.ru)의 텍스트 컬렉션의 가장 빈번한 100,000개의 기본형과 비교하여 동의어 사전 개발의 현재 기간을 설명합니다. 또한 자동 텍스트 처리의 다른 응용 프로그램에서 동의어 사전의 사용을 고려합니다.

숫자 프로젝트, 서적, 브로셔, 인터넷 리소스에서 점점 더 자주 "동의어 사전"을 이해할 수 있습니다. Nemov는 taєmniche yashche vono lyakaє 그의 nezvіdanіstyu입니다. "단어장"이라고 말하기가 더 쉬울지라도 vikoristovuvaty 놀라운 약속을 낮추십시오.

시소러스: 뭔데? 소리 어휘의 잘못은 무엇입니까? 영양 보고서와 이용 가능성을 보도록 합시다.

용어의 해석

동의어 사전의 뒷부분은 영화의 어휘를 본문에 살며시 표현한 사전을 보면 알 수 있었다.

Ozhegov는 시소러스를 지식 갤러리의 체계적인 데이터 수집의 관점에서 데이터 현상에 대한 Efremov의 관점과 유사하게 전 세계의 어휘를 불러 일으키는 특정 언어의 사전으로 해석합니다.

철학은 철자에 가장 구체적으로 할당되며, 동의어 사전 아래에서 사전 유형의 구성 요소가 이해되고 단어의 모든 의미는 의미 론적 단어로 연결되며 sevny 주제에서 이해해야 할 핵심 단어를 나타냅니다. 갤러리.

bachimo처럼 음식에 대한 답을 쉽게 끝낼 수 있습니다. "Thesaurus: what's up?" 분명히. 용어의 더 큰 어휘에 대해서는 어휘의 역사를 살펴보고 유사한 유형의 사전에 파란색 어휘 단위가 있는지 확인하십시오.

와이너리의 역사

동의어 사전의 아버지는 1852년에 태어난 영국의 물리학자 로저입니다. 그룹에 대한 rozpodіlivshi її 체계화. 이 경우 bula의 스킨 그룹은 이해의 이름으로 표시되며 mov의 노래 부분, 분쟁 이름 목록 및 다른 범주의 이름에 대한 참조에 대한 동의어가 부여되었습니다. 그러한 분류에 대한 아이디어는 훨씬 더 가치가 있었고, 어휘의 스크램블러는 가장 자연스러운 것으로 받아 들여져 새로운 세계에서 언어의 어휘를 설명했습니다. shvidky poshuk와 같은 tsomu vin moment buti zastosovaniya가 이해하는 것이 중요할 때. 동의어 사전과 dosі의 첫 시간부터 이러한 유형의 어휘가 정기적으로 변환되어 풍부한 지식의 갈루스 사이에서 정체되어 전 세계적으로 널리 보급됩니다. 주제는 누구를 위한 것입니까: "동의어 사전: 그것은 무엇입니까?" bagatioh 초기 모기지 관련.

지금까지 동의어 사전은 사람을 효과적으로 채택하는 데 필요한 모든 종류의 갤리선에 대한 지식을 설명하는 가장 인기있는 방법입니다.

Vіdnosini slіv u 시소러스

고전 시소러스에서 가장 넓은 글꼴은 다음과 같습니다.

  1. 동의어는 어휘 의미와 유사하게 언어의 한 부분의 단어가 나타나는 현상입니다. 예를 들어: state-vіtchizna, brigade-zagіn, chervoniy - chervoniy
  2. Antonymіya는 다른 어휘 의미를 가질 수있는 mov의 한 부분의 단어 사이의 링크입니다. 예를 들어: 침묵 - gurkit, lagidny - 무례.
  3. Hyperonymy (hyponimia) - 이름 설명의 핵심. Hyperonyms는 광범위한 어휘적 의미를 가질 수 있으며, 객체, 객체, 그 기호의 힘 자체의 클래스(다중)에 대한 일반적이고 노골적인 이름을 표현합니다. Giponim maє vuzke 의미, vіn 특정 승수 또는 클래스의 요소로 주제 (기호, 권한)를 명명합니다. 블루스가 명확해 지도록 가장 단순한 엉덩이를 안내할 수 있습니다. 단어 동물과 호랑이이름이 노골적인 pov'yazanі mіzh 자신 - 즈비르- є hyponym 호랑이에 대한 참조로 hypernym.
  4. Meronimіya (partonimіya) - "부분 - 전체"의 원칙에 따라 접힌 іmennikіv에 대한 vodnosiny. 한 마디의 엉덩이처럼 레탁, 샤시, 일루미네이터. 다른 나라에서 운송 이름은 창고-meronyms와 같은 holonyms (tsile, im'ya)입니다.
  5. Naslіdok (단어 사이에 있음). 예를 들어, 단어 가서 와과정과 요고 후(결과)로 인해.
  6. 이유 (dієslіv에 대해서만 허용됩니다). 그러한 아이디어의 예를 살펴보고 다음 단어를 사용하십시오. 질병 - 스킵. 이러한 변동에는 이유가 있습니다. 건강에 문제가 있었기 때문에 건너뛰십시오.

동의어 사전은 공격적인 엉덩이와 비슷합니다.

Lizhko - 수면 애착.

[대명사]: 가구
[meronym]: 부디녹
[동의어]: 소파, 천.

러시아 동의어 사전의 고전적인 예 대신에 이러한 유형의 모든 어휘는 그러한 원칙에 기반을 두고 있습니다.

동의어 사전 기능

시소러스 사전은 중요한 사회적, 커뮤니케이션, 과학 및 기타 기능을 수행합니다.

와인 번호:

  • 광범위한 주제 영역에 대한 전문 지식의 핵심, 주문 방법, 용어 설명;
  • 정보 흐름 검색 도구;
  • 포크 시스템에서 문서의 수동 분석을 위한 도구;
  • 접는 텍스트의 자동 인덱싱 도구.

동의어 사전 보기

사전을 보고 음식처럼 보이도록 합시다. "Thesaurus: what's the point?" Tse는 이러한 유형의 어휘의 특징을 더 잘 습득하는 데 도움이 됩니다.


비스노보크

우리는 그들이 동의어 사전이 무엇인지 이해하기 쉬운 방식으로 설명할 수 있다고 생각합니다. Zavdyaki 엉덩이는 이해하기 쉽고, chim vіn vіdіznyaєtsya vіd는 slovnikіv를 결정합니다. 또한 수백만 이름의 빠른 검색과 체계화를 위한 정보시스템으로 널리 사용되는 정보검색시소러스에 대한 정보를 공개하였다.

Pid 시소러스어휘의 모든 의미가 설명된 지식의 주제 영역에서 이해해야 할 주요 단어를 반영하는 의미론적 단어와 관련되는 사전 유형의 접을 수 있는 구성 요소가 이해됩니다. 과거에는 동의어 사전이라는 용어가 언어의 어휘를 꽁초로 표현하고 텍스트에 최대한 살아 있었기 때문에 어휘를 더 중요하게 표시했습니다.

동의어 사전 창고에 들어가십시오 토큰, 영화의 몇 부분에서 볼 수 있습니다: prikmetnik, 이름 보유자, 신성 및 형용사. 인벤토리, 영화의 특정 스킨 부분, 다른 구조를 그릴 수 있습니다.

동의어 사전의 주요 기능은 다음과 같습니다.

  • 동의- mov의 한 부분의 단어 사이의 zv'azok, 쓰여진 소리와 다르지만 여전히 다소 가까운 어휘 의미일 수 있습니다. 예를 들면: 기병 - kіnnot, merciful - horobry;
  • 반의어- 마치 정반대의 의미를 가질 수있는 것처럼 소리와 다른 mov의 한 부분의 단어 사이의 zv'azok : 진실-넌센스, 선-악;
  • 저산소증/고농도증. 초의어- 더 대담하고 일반적인 방식으로 표현되는 더 넓은 의미를 가진 단어로 개체(힘, 기호)의 클래스(다수)를 명명합니다. 저명- 클래스(승수)의 요소로 객체(지배, 기호)를 명명하는 중요한 의미를 가진 단어. 파란색의 색상은 전이적이고 비대칭적입니다. Hypernym의 모든 힘의 쇠퇴에 대한 Hyponyms. Є 이름 설명에 대한 중심 참고 사항;
  • meronymy / 동명- Vіdnoshennia "부분-전체". 파란색의 중간 부분은 파란색 "요소가 됨"과 "부러지다"에서 볼 수 있습니다. 약속은 이름으로 만 지정되었습니다.
  • naslіdok (tse vіdnoshennia pov'yazuє mіzh dієslova);
  • 이유(불신앙으로도 지정됨).

시소러스 예:

오두막 - 목조마을집 [대명사] : 생활집 [메로님] : 농촌마을 [동의어] : 집

모든 vіdnosini는 이해하기 위해 접을 수있는 ієrarchіchnuy 측정을 만들고이 측정에서 이해하는 것으로 알려진 사람들에 대한 지식은 tse 이해에 대한 지식의 중요한 부분입니다. 설명할 때 강력한 vіdnosin raznі 다른 부분들헹구기.

안에 다른 시스템동의어 사전은 다른 기능을 가질 수 있습니다.

  • dzherelo spetsialnyh znani vuzkiy 또는 shirokіy 주제 영역, 주제 영역의 용어를 설명하고 주문하는 방법;
  • 정보 및 검색 시스템의 검색 도구;
  • 정보 푸시 시스템에서 문서를 수동으로 인덱싱하는 도구(소위 제어용 사전)
  • 자동 텍스트 인덱싱 도구

영어의 어휘를 집단으로 체계화한 Roger(Abo Roget, 영국의 물리학자)를 집어서 사전을 이해하는 방법으로서 시소러스의 머리. 스킨 그룹은 이해의 이름으로 표시됩니다("카테고리", 천 개가 있습니다. 이 기본 단어는 알파벳 순서로 정렬됩니다(예: 확인 ... 기관 ...). 언어 (이름, 단어 , prikmetniki, 음절), 반의어 및 분쟁 단어 목록 (їх rich 및 deyakі є silannya 다른 범주의 이름, 예를 들어 AGENCY에서 "먼 친척"목록을 계속할 수 있습니다. ... 비즈니스 참조). 1852년 로저의 동의어 사전을 3시간 동안 보았습니다. 그리고 dosі는 다른 종과 다른 koristuvachіv에 대해 다시 방문하는 것을 계속합니다. 동의어 사전은 새로운 어휘와 링크로 지속적으로 업데이트되며 결국 첫 번째 버전의 제작자에게는 일반적인 옵션이 남아 있습니다. 요가의 자연성, 언어의 모든 어휘를 설명하는 tsomu, 용어 이상 및 tsomu의 동의어 사전의 가치는 정보 검색 시스템에서 의미 론적 수준으로 가져갈 수 있습니다. ї의 강도 체계.

Thesauri는 오늘날까지 사람들에게 첨부된 주제 영역에 대한 지식을 설명하는 가장 받아들여지는 형식으로 남아 있습니다. 현대 외국 시소러스의 핵심은 WordNet과 EuroWordNet입니다.

English WordNet의 Thesaurus는 1990년에 등장했습니다. 텍스트 자동 처리의 다른 영역에 적극적으로 접근하기 시작하십시오. WordNet ohoplyuє는 100 yew에 가깝습니다. 이해하기 위해 70,000이 정리한 몇 개(그 중 절반은 단어임)만 있습니다.

그동안 EuroWordNet의 풍부한 동의어 사전이 개발되고 있습니다. 여러 언어(덴마크어, 이탈리아어, 스페인어 및 미국 영어)의 경우 단어의 의미가 확장되고 의미론적 단어와 연결되어 가까이 있는 다른 언어의 단어를 알 수 있습니다. 영어의 어휘 및 개념 체계를 설명하기 위해 만들어진 Roger의 시소러스 및 WordNet 척도에 비추어 볼 때 EuroWordNet은 대규모 텍스트 배열의 자동 처리를 위한 실용적인 작업을 구현하기 위해 우리 앞에 만들어지고 있습니다. 동의어 사전을 돕기 위해 전달되는 가장 중요한 작업은 다음과 같습니다.

  • bagatomo 정보 조회의 보안;
  • zbіlshennya povnot іnformatsiynogo poshuku;
  • 공식은 내 천연 광산에 의해 씻겨 내려갑니다.
  • 문서 및 정보의 시맨틱 인덱싱.

Krіm tsikh vіdnosin은 주제별로 vіdnosin, scho pov'yazuyut 하나의 주제 갤러리에 대한 이해도 소개됩니다. 보드노신의 분리 또는 접합을 의미하는 이해 사이의 보드노신에 특별한 기호를 보내는 것도 필요합니다. 동일한 vodnosin의 merezhі maє kіlka에서 이해할 수 있다면 악취는 이접적일 수 있으므로 그 중 하나가 실제로 실현될 수 있거나 그 중 하나가 결합적일 수 있으므로 이해를 위해 이러한 모든 vodnosin을 이해할 수 있습니다.

100개가 넘는 Galuze 동의어 사전이 votchiznyany 기관에서 마치 노래를 만족시키는 것처럼 만들어졌습니다. 주 표준이 유형의 사전에 대해. 그것이 그들이 - IPT - 정보 및 검색 시소러스라고 불리는 방법입니다. 이해 중에서 가장 가능한 세 가지 의미는 동의어, 속 종("부분 목적"이라고 부를 수 있음) 및 "기타 모든 것"(연관성이라고도 함)으로 고정되어 있습니다.

표준 IPT는 주로 문서의 수동 인덱싱과 검색을 통해 한 시간 동안 요청을 공식화하고 변경하는 데 사용됩니다. 특정 지식 영역, 특히 새로운 주제 영역과 관련된 용어의 체계화를 빠르게 진동시키는 작업을 설정하는 것과 같은 비표준 동의어 사전. 용어로 동의어 사전을 풍부하게 하는 경향이 증가하고 있으며, 이는 특히 다양한 분야의 경우와 더 높은 주제 영역 사이를 벗어날 때 용어의 명확성에 중요합니다.