Методология

Как мы собираем, обрабатываем и публикуем материалы на Тотал.

Источники контента

Тотал работает как агрегатор новостей Казахстана. Мы обрабатываем материалы из казахстанских СМИ и информационных агентств. Каждая агрегированная статья содержит ссылку на первоисточник в поле «Источник».

AI-обогащение

Мы используем искусственный интеллект для извлечения метаданных из текста: ключевые сущности (люди, организации, локации), тематические теги, краткая суммаризация. Это позволяет строить семантический граф публикаций и находить связи между материалами.

NER — распознавание именованных сущностей (модель DeepSeek v3)
Суммаризация — генерация кратких резюме
Тегирование — автоматическое извлечение тематик
Сентимент-анализ — BERT, оценка эмоциональной окраски
Семантический поиск — векторные эмбеддинги (Qdrant + MeiliSearch)

AI не переписывает и не генерирует новый текст. Обогащение — это только добавление структурированных данных поверх оригинального материала.

Маркировка материалов

В соответствии с Законом РК об искусственном интеллекте, подписанным 17 ноября 2025 года и вступившим в силу 18 января 2026 года, каждый материал имеет маркировку о типе AI-обработки:

«Материал обработан с использованием ИИ» — применено обогащение метаданными
«Без обработки ИИ» — исходный вид, маркировка в интерфейсе скрыта

Для оригинальных материалов дополнительно указывается тип контента: «Оригинал», «Перевод», «AI-контент», «Мнение», «Спонсорский».

Редакторский контроль

Агрегированный контент проходит автоматический quality gate: проверка наличия изображений, тегов, минимальной длины. Статьи из доверенных источников публикуются автоматически. Остальные попадают в очередь на модерацию редактора.

Открытые данные

Мы публикуем агрегированную статистику и визуализации в разделе Тотал.Данные. Исходные данные доступны через API по запросу.

Контакты

Вопросы по методологии: editor@total.kz