BelNET logo

Belarusian Nuclear Education and Training Portal - BelNET

eng

rus

Material of portal nuclear knowledge BelNET
article / document resource request "7018"
2026-01-12
Элементы искусственного интеллекта на портале BelNET - наши планы
2. Используемые методы и алгоритмы искусственного интеллекта (ИИ)
С.Н.Сытова

Как следует из первой части статьи, свободное программное обеспечение (СПО), процессный системный подход и семантические технологии являются основой, на которой создаются современные информационные системы. Сюда также в обязательном порядке следует добавить методы и алгоритмы ИИ.


Рисунок с сайта Pixabay

Бурный рост в последнее время инструментов ИИ и тесно связанных с ними семантических технологий предоставляет для интернет-порталов различной направленности такие преимущества их использования, как персонализацию и улучшение пользовательского опыта, оптимизацию поисковых функций, углубление аналитики в части принятия решений. Интернет-ресурсы, находящиеся на переднем крае в части использования ИИ и семантических технологий, получают неоспоримые выгоды, делая их работу эффективнее, удобнее и безопаснее для пользователей.

Бесспорно, что предлагаемые к разработке методы и алгоритмы в рамках портала BelNET должны быть экономичными в реализации, требующими минимальных вычислительных ресурсов, для возможности их эффективной реализации на доступном серверном оборудовании. Это требование накладывает дополнительные ограничения на условия реализации про-екта. Одним из предлагаемых к развитию методов в данном проекте является вектори-зация в рамках вычислительной лингвистики и моделей машинного обучения на базе статистических методов [1, 2].

Чтобы обучить модели машинного обучения на текстовых данных, текст необходимо преобразовать в числовую форму. Этот процесс, называемый векторизацией текста, позволяет алгоритмам понимать и обрабатывать текстовую информацию, поскольку сами по себе тексты не структурированы и не подходят для прямого использования в моделях. Использование техник векторизации позволяет значительно повысить эффективность обработки больших объемов научных данных и документов, способствует усилению информационного обмена, улучшению аналитического инструментария и созданию удобных интерфейсов для пользователей. Векторизация помогает преобразовать тексты статей, препринтов, отчетов и книг в компактное числовое представление (векторы), которое упрощает быстрый точный поиск нужных материалов среди огромного массива информации. Использование методов векторизации также позволяет эффективно проводить сравнительный анализ различных публикаций для формирования персонализированных рекомендаций пользователям портала.

Продолжение следует...

1. Palmer, D. D. Text preprocessing / D. D. Palmer // Handbook of Natural Language Processing, Second Edition. – Chapman and Hall/CRC, 2010. – P. 9–30.

2. A Comparison of Semantic Similarity Methods for Maximum Human Interpretabil-ity / P. Sitikhu [et al.] // Proc. 2019 Artificial Intelligence for Transforming Business and Society (AITB), Kathmandu, Nepal. – 2019. – Vol. 1. – P. 1–4.

Download:
technology-AI-icon.jpg70806image/jpeg2026-01-10 11:14:21
Sign In