Skip to Content
logologo
AI Incident Database
Open TwitterOpen RSS FeedOpen FacebookOpen LinkedInOpen GitHub
Open Menu
Descubrir
Enviar
  • Bienvenido a la AIID
  • Descubrir Incidentes
  • Vista espacial
  • Vista Tabular
  • Vista de lista
  • Entidades
  • Taxonomías
  • Enviar Informes de Incidentes
  • Ranking de Reportadores
  • Blog
  • Resumen de noticias de IA
  • Control de Riesgos
  • Incidente aleatorio
  • Registrarse
Colapsar
Descubrir
Enviar
  • Bienvenido a la AIID
  • Descubrir Incidentes
  • Vista espacial
  • Vista Tabular
  • Vista de lista
  • Entidades
  • Taxonomías
  • Enviar Informes de Incidentes
  • Ranking de Reportadores
  • Blog
  • Resumen de noticias de IA
  • Control de Riesgos
  • Incidente aleatorio
  • Registrarse
Colapsar

Problema 1471

Incidentes Asociados

Incidente 1361 Reporte
Brand Safety Tech Firms Falsely Claimed Use of AI, Blocking Ads Using Simple Keyword Lists

Sabíamos que la tecnología de seguridad de la marca era mala: esto es lo mal que desfinancia The News
forbes.com · 2020

Sabemos desde hace mucho tiempo que las tecnologías de detección de seguridad de marca eran instrumentos contundentes [1], [2], [3], [4], [5]. A pesar de sus afirmaciones de IA avanzada (inteligencia artificial) y ML (aprendizaje automático) en sus materiales de ventas, estaba dolorosamente claro que la tecnología de seguridad de la marca estaba bloqueando anuncios basados en listas de palabras clave simples. Este no es un fenómeno nuevo, solo más fácilmente observable al comienzo de la pandemia cuando los anuncios en las portadas del New York Times y el Wall Street Journal fueron bloqueados y reemplazados por "anuncios en la nube" solo porque la página contenía la palabra "covid-19". 19” o “coronavirus”. Entonces, mientras que los anunciantes pagaban por estas tecnologías de seguridad de la marca, con la esperanza de que ayudaran a mantener los anuncios fuera de los sitios que no eran seguros para la marca, en cambio, estaban bloqueando los anuncios de los anunciantes en los sitios de noticias principales legítimos. El resultado de este bloqueo es que fluyen más anuncios y dólares a sitios de menor calidad en canales programáticos: exactamente el efecto opuesto al que los anunciantes pensaban que sucedería.

Lograr que la seguridad de la marca sea correcta es difícil

No me malinterpretes. Obtener la seguridad de marca correcta es difícil. Eso es porque las palabras tienen significado, las frases pueden tener diferentes significados, el idioma inglés tiene muchos juegos de palabras y modismos, y el contexto es importante. Por ejemplo, la palabra "sangre" puede ser indeseable o "no segura para la marca" cuando aparece en un sitio de consumo; pero la misma palabra "sangre" está bien y es necesaria en un sitio médico. Otros han documentado que el bloqueo de palabras clave es una práctica muy común. Pero a menudo es humorísticamente defectuoso. "Por ejemplo, "disparar" es uno de los términos más comunes de la lista negra. Si bien puede identificar algún contenido sobre violencia, ese término también bloqueará contenido de aficionados a la astronomía (estrellas fugaces), fanáticos de los deportes (aros de tiro), usuarios de tecnología (resolución de problemas). ), fotógrafos (tomando una foto) y jugadores de cartas (tomando la luna)." (Fuente: AdAge)

Obtener la seguridad de la marca a escala es aún más difícil. La tecnología de seguridad de la marca tiene unos pocos milisegundos para determinar si una página es segura o no para la marca cuando su etiqueta de detección está en el iframe del anuncio, o la tecnología tiene que realizar un rastreo masivo para indexar miles de millones de páginas web y millones de sitios. Estos rastreadores son programas de software que cargan las páginas web y recopilan todo el contenido de texto de la página para el análisis de seguridad de la marca. El desafío es que las páginas web modernas cambian con frecuencia o tienen contenido dinámico cargado por javascript (por ejemplo, clima, resultados deportivos, noticias, presentaciones de diapositivas, etc.). El contenido puede cambiar después de que el rastreador de seguridad de la marca realice una determinación de "seguridad de la marca" para la página. Esto significa que es posible que una página que se marcó como "segura" ya no lo sea, o que un sitio marcado como "inseguro" ya no sea "inseguro". Además, los estafadores que operan sitios falsos evitan meticulosamente las palabras clave marcadas con mayor frecuencia como "brand_unsafe" y, por lo tanto, obtienen todos los anuncios y dólares publicitarios que fueron bloqueados para que no fueran a los principales editores legítimos como New York Times, Wall Street Journal, etc.

En las tablas anteriores hay ejemplos de "clasificadores de contenido" vistos en la red publicitaria más grande. Mire de cerca los dominios y cómo fueron clasificados. Algunas categorías son claramente incorrectas, mientras que otras simplemente pueden estar incompletas e imprecisas, y todo el sitio no se puede categorizar fácilmente en una sola categoría, al igual que las canciones pueden no encajar perfectamente en un solo género musical. Hemos revisado casos en el pasado en los que sitios completos se bloquean o se incluyen en la lista negra debido a que el contenido no es seguro para la marca en algunas páginas. CBSnews.com marcado como "armas" es probable que haya una noticia que contenía la palabra "armas".

Cuantificación del impacto negativo en los ingresos publicitarios de los editores

Sabíamos que la tecnología de seguridad de la marca era mala (no funcionaba tan bien como prometían) y que era una mala noticia (reduce los ingresos publicitarios de los editores legítimos), pero no sabíamos exactamente qué tan grave era la situación. Una nueva investigación publicada hoy por Adalytics ayuda a cuantificar el impacto negativo de las tecnologías de seguridad de marca en los ingresos publicitarios de los principales editores. “Este estudio exploratorio muestra que aproximadamente el 21 % de los artículos de economist.com, el 30 % de nytimes.com, el 30 % de wsj.com y el 52 % de los artículos de vice.com están etiquetados como ‘marca insegura’. Cuando una página está marcada como "brand_unsafe", la señal se pasa a las ofertas en tiempo real. Los anunciantes que elijan evitar entornos inseguros verán bloqueados sus anuncios en estas páginas y sitios.

Pero, ¿son precisas las designaciones de seguridad de la marca? La evidencia anterior sugiere que el etiquetado de cada proveedor es problemático en el mejor de los casos y completamente incorrecto en el peor. Al comparar las designaciones de diferentes proveedores, podemos cuantificar qué tan impreciso es su etiquetado, por ejemplo, cuando dos proveedores clasifican el mismo artículo de manera diferente, como seguro o inseguro. Según una muestra de 25 730 artículos de wsj.com encontrados en varios repositorios de archivos de Internet, parece que Moat y Comscore no están de acuerdo aproximadamente el 40 % de las veces al clasificar un artículo como "seguro" o "inseguro".

En otras palabras, "por cada 10 artículos en wsj.com, un promedio de cuatro recibirían valores de seguridad de marca en conflicto etiquetados como 'seguros'/'inseguros' o 'inseguros'/'seguros' por los dos proveedores". Los datos también sugieren que las tecnologías de detección de seguridad de la marca no buscaron texto dentro de las imágenes ni analizaron las imágenes en busca de problemas de seguridad de la marca.

Impacto negativo descomunal en temas serios y páginas de alto tráfico

Finalmente, los datos del estudio muestran cómo los periodistas que se enfocan en ciertos temas "serios", como asuntos de Medio Oriente, obituarios o ciertos eventos políticos, tienen una probabilidad desproporcionada de que los proveedores de seguridad de marca marquen su trabajo como "inseguro". Esto hace que se bloqueen los anuncios y que se retiren los fondos de estos sitios de noticias principales. Incluso un artículo reciente sobre la muerte del futbolista argentino Diego Maradona fue marcado como 'moat_unsafe' y 'gv_death_injury'. Los artículos biomédicos que usan el término "muerte celular" como sinónimo de apoptosis se marcan de manera similar como "brand_unsafe" debido a la palabra "muerte".

Más allá del porcentaje de todas las páginas desfinanciadas por la tecnología de seguridad de la marca, si las páginas de alto tráfico como la página de inicio se bloquean debido a que son "marca_inseguras", el impacto en los ingresos publicitarios es desproporcionadamente mayor que si se bloquean las páginas de artículos de bajo volumen. Las páginas de inicio de los sitios convencionales son, con mucho, las páginas con mayor tráfico de todo el sitio web. El siguiente gráfico de Adalytics muestra la página de inicio del New York Times y los artículos vinculados desde la página de inicio. Tenga en cuenta los artículos marcados en cuadros rojos: los proveedores de seguridad de marca los marcan como "brand_unsafe". El impacto negativo de la tecnología de seguridad de la marca en los sitios de los principales editores es visible y significativo. El uso de tecnología de seguridad de marca por parte de los especialistas en marketing está desfinanciando sitios legítimos y financiando sitios malos, lo contrario del efecto deseado.

¿Y qué? ¿Qué pueden hacer los especialistas en marketing en su lugar?

Deje de gastar dinero en tecnología de seguridad de marca que no funciona y está causando más daño activamente. Como hemos visto anteriormente, el uso de proveedores de detección de seguridad de marca es malo para los editores: los anuncios bloqueados debido a medidas incorrectas de seguridad de marca significan que esos editores pierden ingresos publicitarios. El uso de proveedores de detección de seguridad de la marca también es malo para los anunciantes: los anuncios se bloquean en los sitios web principales, por lo que los anuncios y los presupuestos publicitarios fluyen hacia sitios peores. Pagar por tecnología de seguridad de la marca que no funciona bien o que no funciona en absoluto es como tirar el dinero bueno al malo. Es como resolver un problema que no existiría si los especialistas en marketing compraran anuncios de los principales editores buenos en primer lugar, en lugar de difundir sus anuncios en millones de sitios de cola larga que nadie ha visto o visitado nunca. Es como tratar de detectar la salida de un problema usando tecnología defectuosa y rudimentaria, y eso es literalmente una tontería. Los proveedores de detección de seguridad de marca serán los primeros en insistir en que debe seguir pagando por su tecnología o, de lo contrario, sus anuncios pueden terminar junto a un video de decapitación de terroristas. Pero sus anuncios no terminarían allí si no colocara anuncios en UGC (contenido generado por el usuario) en primer lugar, de manera similar para millones de sitios de cola larga en canales programáticos.

Para empezar, los especialistas en marketing deben pasar a usar "listas de inclusión" estrictas con sitios que tienen audiencias humanas reales. Como ejercicio de pensamiento simple, pregúntese cuántos sitios conocen los humanos y visitan regularmente. Examine su propia experiencia personal todos los días. ¿Cuántos sitios visita regularmente todos los días? Los especialistas en marketing pueden ahorrar dinero al NO renovar y NO pagar por la tecnología de detección de seguridad de la marca que hace más daño que bien, y publicar anuncios en editores principales, buenos y reales. El sentido común le dirá que los anuncios que se publican en un artículo de The Economist sobre la muerte de la leyenda del fútbol Diego Maradona no son "brand_unsafe", incluso si la tecnología de detección de BS lo marca como tal.

Leer la Fuente

Investigación

  • Definición de un “Incidente de IA”
  • Definición de una “Respuesta a incidentes de IA”
  • Hoja de ruta de la base de datos
  • Trabajo relacionado
  • Descargar Base de Datos Completa

Proyecto y Comunidad

  • Acerca de
  • Contactar y Seguir
  • Aplicaciones y resúmenes
  • Guía del editor

Incidencias

  • Todos los incidentes en forma de lista
  • Incidentes marcados
  • Cola de envío
  • Vista de clasificaciones
  • Taxonomías

2024 - AI Incident Database

  • Condiciones de uso
  • Política de privacidad
  • Open twitterOpen githubOpen rssOpen facebookOpen linkedin
  • 86fe0f5