Исходный текст - определите полное имя файла,
содержащего анализируемый авторский текст. Файл не должен содержать высокоуровневого
форматирования (т.е. форматы, подобные ".doc" MS-Word не годятся.
Если же авторский текст - в файле формата ".doc", то его можно сохранить
без форматирования: меню "Файл" -> "Сохранить как..."
и указать тип файла: "Текст DOS" (кодировка Cp866)
В выпадающем списке необходимо определить
кодировку, в которой записан анализируемый текст. Это может быть:
Cp866 - кодировка DOS для кириллицы
Cp1251 - кодировка Windows для кириллицы
KOI8-R - альтернативная кодировка для кириллицы
Любая другая кодировка, поддерживаемая установленной Java - машиной
Текст без разбиения на строки/Текст с разбиением -
если анализируемый текст содержит символы обрыва строки и(или) возврата каретки
только для выделения новых абзацев, укажите первый пункт - "Текст
без разбиения на строки". Если же такие символы есть в конце каждой
строки, выберите второй пункт - "Текст с разбиением"
Автор - укажите автора анализируемого текста
Произведение - укажите название произведения
Результаты анализа - укажите полное имя файла
(HTML - формат), в который программа запишет результат анализа
В ходе анализа программа собирает различные статистические
данные и записывает их в файл результатов в виде таблиц отношений или процентного
содержания:
Общие данные
Содержание знаков препинания
Содержание завершающих знаков препинания
Содержание предложений в абзаце
Содержание слов в предложении
Содержание знаков препинания в предложении
а также таблиц анализа штампов:
Повторение штампов n-го уровня
Повторение штампов n-го уровня в одном абзаце
Повторение штампов n-го уровня в одном предложении
где под штампом n-го уровня понимается
словосочетание из n слов. Т.е. штамп 1-го уровня - это одно слово, а 5-го
уровня - словосочетание из 5 слов.
Сравнительный анализ текстов
Определите следующие поля диалога:
Первый файл статистики, Второй файл статистики -
определите полные имена файлов, содержащих результаты статистического
анализа сравниваемых авторских текстов
Результаты сравнения - укажите полное имя
файла (HTML - формат), в который программа запишет результат сравнительного
анализа
В ходе сравнительного анализа программа вычисляет выраженные
в процентах разности соответствующих таблиц данных, полученных на этапе статистического
анализа текстов. Такие данные характеризуют отличие таблиц, и, чем выше
их значение, тем ниже вероятность идентичности авторства исходных текстов.