05.10.2022, 15:15 | |
Корпус слов "Омографы" создан на основе более 48000 книг. Представляет собой более тысячи (по количеству омографов) текстовых файлов в ANSI кодировке в разрезе каждого отдельного слова-омографа. Название файла соответствует слову-омографу. Весь файл - это строки с найденными в книгах предложениями, которые содержат соответствующее слово-омограф. Текст в предложениях никак не размечен (представлен в виде "как есть", т.е. как в оригинальном тексте из книги) т.к. некоторые файлы большие по размеру, то открывать файлы лучше в Демагоге х64 или осуществлять "прстрочный" поиск по файлу (без его открытия) при помощи скрипта для Демагога: В распакованном виде Корпус слов "Омографы" занимает 16,8 GiB
| |
| |
Просмотров: 256 | Загрузок: 16 | |
Всего комментариев: 0 | |