Методология и AI-обогащение
Как мы собираем, обрабатываем и публикуем материалы на Тотал.
Источники контента
Тотал работает как агрегатор новостей Казахстана и Центральной Азии. Мы обрабатываем материалы из официальных СМИ и информационных агентств региона. Каждая агрегированная статья содержит ссылку на первоисточник в поле «Источник».
AI-обогащение
Мы используем искусственный интеллект для извлечения метаданных из текста: ключевые сущности (люди, организации, локации), тематические теги, краткая суммаризация. Это позволяет строить семантический граф публикаций и находить связи между материалами.
- NER — распознавание именованных сущностей (модель DeepSeek v3)
- Суммаризация — генерация кратких резюме
- Тегирование — автоматическое извлечение тематик
- Сентимент-анализ — BERT, оценка эмоциональной окраски
- Семантический поиск — векторные эмбеддинги (Qdrant + MeiliSearch)
AI не переписывает и не генерирует новый текст. Обогащение — это только добавление структурированных данных поверх оригинального материала.
Маркировка материалов
В соответствии с Законом РК об искусственном интеллекте (вступил в силу в январе 2026), каждый материал имеет маркировку о типе AI-обработки:
- «Материал обработан с использованием ИИ» — применено обогащение метаданными
- «Без обработки ИИ» — исходный вид, маркировка в интерфейсе скрыта
Для оригинальных материалов дополнительно указывается тип контента: «Оригинал», «Перевод», «AI-контент», «Мнение», «Спонсорский».
Редакторский контроль
Агрегированный контент проходит автоматический quality gate: проверка наличия изображений, тегов, минимальной длины. Статьи из доверенных источников публикуются автоматически. Остальные попадают в очередь на модерацию редактора.
Открытые данные
Мы публикуем агрегированную статистику и визуализации в разделе Тотал.Данные. Исходные данные доступны через API по запросу.
Контакты
Вопросы по методологии: editor@total.kz