Мetafraz.ru - Сайт компании МетаФраз
Гость | Вход
Системы машинного перевода
и смысловой обработки текстов,
информационно-аналитические
и поисковые системы

Metafraz.ru / Продукты / Система семантической обработки текстов

Система семантической обработки текстов

МетаФраз Текстовый аналитик R10

Официальное наименование: Автоматизированная система обработки текстовой информации «МетаФраз Текстовый аналитик R10».

На английском языке: Metafraz Text Analyst R10 – Automated system for textual information processing.

Общие сведения о Системе

МетаФраз Текстовый аналитик R10 – автономная автоматизированная система семантической (смысловой) обработки неструктурированной текстовой информации, включающая электронную библиотеку документов.

МетаФраз Текстовый аналитик R10 реализована как Windows-приложение на базе программно-технологической платформы лингвистического программного обеспечения (ПО) МетаФраз R10.

МетаФраз Текстовый аналитик R10 имеет пользовательский интерфейс в стиле MS Word 2010.

Текущая версия системы разработана в 1-м квартале 2014 года. В настоящее время продолжается разработка полнофункциональной многопользовательской сетевой автоматизированной системы и добавление в систему дополнительного функционала семантической обработки текстов.

Назначение Системы

  • Ведение персональной электронной библиотеки документов.
  • Лингвистическая обработка и семантический анализ неструктурированных текстовых документов, автоматическое создание формализованного представления документов.
  • Поиск и отбор документов с использованием технологий семантического поиска и установления степени семантической близости документов.

Ключевые преимущества Системы

1. Ведение персональной электронной библиотеки документов:

  • Загрузка в БД текстовых документов в самых распространенных форматах (TXT, DOC, DOCX, PDF) с сохранением иерархии папок;
  • одинаковые документы добавляются в БД однократно с ссылками на все их источники;
  • возможность хранения в БД исходных файлов или ссылок на них в файловой системе;
  • наглядная навигация по электронной библиотеке, поиск и подбор документов.

2. Автоматическое формирование формализованного представления документов:

  • выделение ключевых выражений, объектов и связей из документа с возможностью их контекстного поиска и подсветки;
  • визуализация связей между объектами на графе;
  • автоматическое создание рефератов и переводов по документу.

3. Семантический поиск, отбор и сравнение документов:

  • семантический поиск в документах с обогащением поисковых запросов;
  • подбор сходных документов по ключевым выражениям и объектам;
  • сравнение нескольких документов между собой по смыслу.

Основные функциональные возможности Системы

  • Загрузка в БД электронной библиотеки из файловой системы документов в формате:
    • текстовые документы (TXT);
    • документы MS Word (DOC, DOCX);
    • PDF.
  • Автоматическое конвертирование в текстовый формат документов MS Word и PDF при отсутствии текстовой версии.
  • Автоматическая смысловая обработка документов и перевод:
    • нормализация текста (для повышения качества поиска средствами СУБД);
    • создание формализованного представления документа в виде концептуального образа документа (КОД), содержащего выделенные из текста ключевые выражения, характерные для данной предметной области;
    • классификация выделенных выражений;
    • автоматическое составление аннотации (общего реферата) по документу;
    • автоматическое составление контекстных рефератов по документу в различных разрезах с учетом пользовательской тематики или поискового запроса;
    • автоматический перевод документа (с различными словарями);
    • выделение объектов (организации, персоны, должности, бренды и т.д.);
    • определение и типизация связей между объектами;
    • сравнение документов и установление степени их семантической близости для задач кластеризации (группировки документов по смыслу) и антиплагиата.
  • Навигация по электронной библиотеке:
    • сохранение иерархической структуры документов в БД (в соответствии с файловой структурой);
    • возможность фильтрации документов по реквизитам;
    • возможность определения избранных документов;
    • сохранение истории просмотра документов.
  • Поиск по электронной библиотеке:
    • возможность строгого и морфологического поиска (с учетом словообразования и словоизменения);
    • возможность поиска выражений в документов по смыслу (с расширением запросов синонимами, гипонимами-гиперонимами);
    • поиск с переводом поискового запроса;
    • поиск контекстов выражений (поиск определений понятий).
    • сохранение истории поиска документов.

Компоненты Системы

N Наименование программного продукта, ресурса Назначение в системе, отличие версий
1 MF Dictionary Lib R10 Библиотека словарей МетаФраз – комплекс словарей и грамматических таблиц.
Версии различаются по составу языков (направлений) перевода и набору тематических словарей
2 MF Text Analyst R10 Система семантической обработки текстов МетаФраз для обработки неструктурированных текстов на естественном языке, извлечения сущностей и установления связей, рубрикации и кластеризации документов, морфологического и семантического поиска и подбора документов, их автоматического реферирования и перевода (включает электронную библиотеку документов).
На настоящий момент представлена в единственной версии – Standard.

Наименование лицензий и комплектации Системы

N Наименование версии автоматизированной системы (наименование лицензии) Состав компонентов (инсталляционных пакетов)
1 Автоматизированная система обработки текстовой информации «МетаФраз Текстовый аналитик R10. Стандартная версия» MF Dictionary Lib R10
MF Text Analyst R10 Standard

В связи с продолжением разработки полнофункциональной многопользовательской сетевой автоматизированной системы и добавления в систему функционала семантической обработки текстов состав версий (лицензий) и комплектаций системы будет меняться.

Системные требования

Операционная система (ОС) MS Windows Server 2003 или выше;
MS Windows Vista;
MS Windows 7;
MS Windows 8;
MS Windows 8.1;
MS Windows 10.
Разрядность ОС 32-разрядная ОС (х86);
64-разрядная ОС (х64).
Приложение МетаФраз R10 32-разрядное, на 64-разрядных ОС выполняется в режиме эмуляции x86.
Системное окружение MS .Net Framework 3.5;
MS .Net Framework 4.0.
Оперативная память (RAM) Минимальные требования – не ниже 2 Gb.
Рекомендуемый размер RAM – от 4 Gb и выше.
Дисковое пространство Свободное дисковое пространство на момент установки – 1 Gb.
Права на установку Для установки ПО МетаФраз необходимы права администратора, обеспечение возможности записи в системный реестр и копирования файлов в папки C:/Program Files и C:/ProgramData.
Установка по умолчанию производится в папку C:/Program Files/Metafraz.
Установленные компоненты МетаФраз R10 Для всех продуктов МетаФраз (за исключением версий Net Client) – наличие предварительно установленной Библиотеки словарей МетаФраз (MF Dictionary Lib R10).
 
© OOO "МетаФраз", 2018 г.
Москва, ул. Бауманская, 7, стр. 1