Документация данных Salesfocus
Серверные признакиunknown_mapping_detected

unknown_mapping_detected

Что означает

Показывает, где разметка не покрывает сайт.

Mapping QA-признаки показывают unknown/suspect mapping, чтобы оператор мог исправить config даже после сбора событий.

Исходные события

  • page_view
  • click
  • object_visibility_checkpoint with mapping_status unknown/suspect

Алгоритм

  • Триггер: После обработки batch.
  • Расчет: unknown_type, selector_hash, object_type, page_code, count.
  • Приоритет: P1; рассчитывается сервером: Да.
  • Не просите SDK отправлять unknown_mapping_detected напрямую: сервер выводит это событие из принятых source-событий или безопасных импортов.

Текущий статус реализации: отправляется текущим backend/app/services/derived_processor.py, когда присутствуют нужные source-сигналы.

Формат хранения

Хранится в sf_server_derived_events с derived_type = "unknown_mapping_detected", derived_ts, source_event_id, если строка связана с конкретным source-событием, а также batch_id, session_id, mapping_version и payload_json.

Для агрегатов уровня сессии source_event_id может быть пустым; последнее состояние сессии также отражается в sf_session_snapshots, когда это применимо.

Пример payload

{ "derived_type": "unknown_mapping_detected", "source_event_id": "evt_example_or_empty", "mapping_version": "map_active", "payload": { "unknown_type": "example", "selector_hash": "example", "object_type": "example", "page_code": "example", "count": "example" } }

Примеры и допустимые значения из Excel: unknown_type: page,block,element,group.

Крайние случаи

Если данных много — агрегировать по hash+page_code.

Если обязательных checkpoints не хватает, снижайте confidence или помечайте payload как partial. Никогда не синтезируйте положительный intent-сигнал только из-за отсутствия события.

Дашборд

Ожидаемое окно live-debug: Неизвестный / сомнительный mapping.

Если строка относится к загруженной сессии, она также должна находиться в окне Лента сессии.

Использование в ML

Не использовать unknown в clean semantic features.

Используйте стабильные codes и buckets вместо сырого текста, сырых URL или строк из DOM. Отсутствующие значения должны быть явными (not_available, unknown, partial), чтобы CatBoost отличал отсутствие сигнала от отрицательного сигнала.

Использование в детекции ботов

Много unknown чаще проблема mapping, не бот.

Логика детекции ботов должна комбинировать этот признак с независимыми поведенческими сигналами; эта страница не разрешает fingerprinting, cookies, canvas/WebGL/audio probes или сырые значения форм.

QA-проверки checklist

  • Сгенерируйте перечисленные source-события в одной сессии.
  • Запустите server-derived обработку для этой сессии.
  • Проверьте, что sf_server_derived_events содержит строку derived_type = "unknown_mapping_detected" или что событие явно помечено как еще не реализованное.
  • Откройте окно live-debug дашборда Неизвестный / сомнительный mapping и проверьте, что строка ссылается обратно на эту страницу.
  • Проверьте, что payload_json содержит только безопасные поля из списка выше и не содержит сырые ПДн, query string, cookies или значения форм.

Связанные страницы

Обновлено