Automatische “Zensur” per Textanalyse
Es ist klar, dass man erst an Zensur denkt, wenn man eine Meldung wie die bei Gutjahr liest. Ein Blogbeitrag sorgt dafür, dass der Werberiese den Autor auffordert seine Inhalte zu ändern. 70 € hatte er verdient mit seinem Blog….
Schaut man sich den Stein des Anstoßes an, so fällt bereits in der URL auf, dass da zumindest einige Worte vorkommen, die nicht ganz jugendfrei sind.
Soweit so schlecht, denn ich kann mir irgendwie nicht vorstellen, dass ein Unternehmen welches sich mit Suche im Internet beschäftigt – solche Beiträge nicht automatisch findet. Doch wie? Ist es rein das Auftreten der Begriffe im Text (und in der URL) ?
Mit Sicherheit nein, denn sonst müsste man halb China damit beschäftigen die falschen Alarme zu kontrollieren. Vielmehr werden wahrscheinlich per automatisierter Textanalyse zunächst die Schlüsselkonzepte und deren Verhältnis zueinander ermittelt. Danach wird diese Extraktion mit Mustern und Konzepten verglichen, die man vorher als “jugendfeindlich” eingestuft hat. Wird eine gewisse Alarmschwelle überschritten, so geht man davon aus, dass der Sachverhalt vorliegt und somit die beschrieben Mail verschickt.
Das gleiche Verfahren wird übrigens auch bei Spamfiltern verwendet – wenn auch die Konzepte meist anders realisiert werden.
Richard Gutjahr fragt am Ende seines Beitrages nach Meinungen. Ich meine, dass er die versehentlich im Spamordner gelandete Mail mit seinem Post geschaffen hat. Wichtig ist aber, das Google vernünftig reagiert und Wege zum Beheben der Fehlanalyse aufzeigt.
No related posts.
