Die Algorithmus-Ranking-Faktoren von Twitter: Ein definitiver Leitfaden
Veröffentlicht: 2022-07-01Twitter-Patente und andere Veröffentlichungen enthüllen wahrscheinliche Aspekte, wie Tweets in den Timeline-Feeds von Benutzern beworben werden.
Einige Ranking-Faktoren auf der Zeitachse von Twitter sind sehr überraschend, und eine Anpassung Ihrer Herangehensweise an das Tweeten kann Ihnen dabei helfen, eine größere Sichtbarkeit Ihrer Tweets zu erreichen.
Basierend auf einer Reihe wichtiger Patente und anderer Quellen habe ich hier eine Reihe wahrscheinlicher Ranking-Faktoren für den Algorithmus von Twitter skizziert.
Die Twitter-Timeline
Twitter begann erstmals im Jahr 2016 mit der Verwendung einer algorithmusbasierten Zeitleiste, als es von einem rein chronologischen Feed von Tweets aller Konten, denen man folgte, umstellte. Durch die Änderung wurden die Timelines der Benutzer in eine Rangfolge gebracht, damit sie „die besten Tweets zuerst“ sehen konnten. Twitter hat seitdem bis heute mit Variationen davon experimentiert.
Ein Feed-basierter Algorithmus für soziale Medien ist keine Seltenheit. Facebook und andere Social-Media-Plattformen haben dasselbe getan.
Die Gründe für diesen Wechsel zu einer algorithmischen Mischung von Timeline-Tweets sind ziemlich klar. Eine rein persönliche, chronologische Zeitleiste, die nur aus den Konten besteht, denen man gefolgt ist, ist sehr isoliert und daher begrenzt – während das Einführen von Posts von Konten außerhalb der eigenen direkten Verbindungen das Potenzial hat, die Zeit zu verlängern, die man auf der Plattform verbringt, was wiederum die allgemeine Klebrigkeit erhöht, was wiederum den Wert des Dienstes für Werbetreibende und Datenpartner erhöht.
Verschiedene Interessenklassifikationen von Benutzern und Interessensthemen, die mit ihren Konten und Tweets verbunden sind, ermöglichen ferner ein Potenzial für eine zielgerichtete Werbung basierend auf Benutzerdemografien und Inhaltsthemen.
Twitter-Power-User haben möglicherweise einige Intuitionen über verschiedene Tweet-Faktoren entwickelt, die zu einer größeren Sichtbarkeit innerhalb des Algorithmus führen können.
Eine Erinnerung an Patente
Konzerne melden ständig Patente für Erfindungen an, die sie nicht wirklich im Live-Betrieb nutzen. Als ich bei Verizon gearbeitet habe, habe ich persönlich eine Reihe von Patententwürfen für verschiedene Erfindungen geschrieben, die meine Kollegen und ich im Laufe unserer Arbeit entwickelt haben – darunter auch Dinge, die wir nicht in der Produktion verwendet haben.
Die Tatsache, dass Twitter Patente besitzt, in denen Ideen erwähnt werden, wie Dinge funktionieren könnten, garantiert noch lange nicht, dass die Dinge auch so funktionieren .
Außerdem enthalten Patente in der Regel mehrere Ausführungsformen, die im Wesentlichen verschiedene Möglichkeiten darstellen, wie eine Erfindung implementiert werden könnte – Patente versuchen, die Schlüsselelemente einer Erfindung so umfassend wie möglich zu beschreiben, um jede mögliche Verwendung zu beanspruchen, die ihr zugeschrieben werden könnte.
Schließlich ist es, genau wie beim berühmten PageRank-Algorithmus-Patent, das die Grundlage der Google-Suchmaschine war, in Fällen, in denen Twitter eine Ausführungsform aus einem ihrer Patente verwendet hat, sehr wahrscheinlich, dass sie die beschriebenen einfachen, umfassenden Erfindungen geändert und verfeinert haben. und werde dies auch weiterhin tun.
Trotz all dieser typischen Vagheit und Ungewissheit fand ich eine Reihe sehr interessanter Konzepte in den Twitter-Patentbeschreibungen, von denen viele höchstwahrscheinlich in ihr System integriert werden.
Twitter und Deep Learning
Eine zusätzliche Einschränkung, bevor ich fortfahre, betrifft, wie der Timeline-Algorithmus von Twitter Deep Learning in seine DNA integriert hat, gekoppelt mit verschiedenen Ebenen menschlicher Überwachung, was es zu einem sich häufig, wenn nicht ständig, selbst entwickelnden Tier macht.
Dies bedeutet, dass sowohl große als auch kleine, inkrementelle Änderungen bei der Durchführung des Content-Rankings auftreten können und werden. Darüber hinaus kann dieser Ansatz des maschinellen Lernens dazu führen, dass die Techniker von Twitter aufgrund der Abstraktion der erstellten Ranking-Modelle möglicherweise nicht direkt genau wissen, warum einige Inhalte angezeigt werden oder andere Inhalte übertreffen, ähnlich wie ich es beschrieben habe, als ich über die von Google erstellten Modelle geschrieben habe Qualitätsranking durch maschinelles Lernen.
Trotz der Komplexität und Raffinesse der Funktionsweise des Twitter-Algorithmus kann das Verständnis der Faktoren, die wahrscheinlich in die Blackbox einfließen, immer noch zeigen, was die Rankings beeinflusst.
Die ursprüngliche Zeitleiste von Twitter bestand einfach aus allen Tweets der Konten, denen man seit seinem letzten Besuch gefolgt ist, die gesammelt und in umgekehrter chronologischer Reihenfolge angezeigt wurden, wobei die neuesten Tweets zuerst angezeigt wurden und jeder frühere Tweet nacheinander beim Scrollen angezeigt wurde nach unten.
Der aktuelle Algorithmus besteht immer noch größtenteils aus derselben umgekehrt chronologischen Auflistung von Tweets, aber Twitter führt eine Neurangfolge durch, um zu versuchen, die interessantesten Tweets in erster Linie aus den letzten Tweets anzuzeigen.
Im Hintergrund wird den Tweets von einem Relevanzmodell ein Ranking-Score zugewiesen, das vorhersagt, wie interessant jeder Tweet wahrscheinlich für Sie sein wird, und dieser Score-Wert gibt die Rangfolge vor.
Die Tweets mit den höchsten Punktzahlen werden zuerst in deiner Timeline-Liste angezeigt, während die restlichen neuesten Tweets weiter unten angezeigt werden. Bemerkenswert ist, dass in Ihrer Chronik jetzt auch Tweets von Accounts eingestreut sind, denen Sie nicht folgen, sowie einige Werbe-Tweets.
Das Verbindungsdiagramm von Twitter
Zunächst einmal ist einer der einflussreichsten Aspekte der Twitter-Timeline, wie Twitter jetzt Tweets anzeigt, basierend nicht nur auf Ihren direkten Verbindungen zu diesem Zeitpunkt, sondern im Wesentlichen auf Ihrem einzigartigen sozialen Diagramm, das Twitter in Patenten als „ Verbindungsdiagramm“.
Das Verbindungsdiagramm stellt Konten als Knoten und Beziehungen als Linien („Kanten“) dar, die einen oder mehrere Knoten verbinden. Eine Beziehung kann sich auf Verknüpfungen zwischen Twitter-Konten beziehen.
Zum Beispiel Folgen, Abonnieren (z. B. über das Super Follows-Programm von Twitter oder möglicherweise für Twitters angekündigte Abonnementfunktion für Schlüsselwortabfragen), Liken, Markieren usw. – all dies schafft Beziehungen.
Beziehungen im eigenen Verbindungsgraphen können unidirektional (z. B. ich folge dir) oder bidirektional (z. B. wir beide folgen einander) sein. Wenn ich dir folge, aber du mir nicht folgst, hätte ich eine größere Erwartung, dass deine Tweets und Retweets in meiner Chronik erscheinen, aber du würdest nicht unbedingt erwarten, meine zu sehen.
Einfach basierend auf dem Verbindungsdiagramm sehen Sie wahrscheinlich Tweets und Retweets von denen, denen Sie folgen, sowie Tweets, die Ihren Verbindungen gefallen oder auf die sie geantwortet haben.
Der Twitter-Algorithmus hat Tweets erweitert, die Sie möglicherweise über die Konten hinaus sehen, mit denen Sie direkt interagiert haben. Die Tweets, die du möglicherweise in deiner Chronik siehst, umfassen jetzt auch Tweets von anderen, die über Themen posten, denen du gefolgt bist, Tweets, die in gewisser Weise Tweets ähneln, die du zuvor mit „Gefällt mir“ markiert hast, und Tweets, die auf Themen basieren, die der Algorithmus vorhersagt , die dir gefallen könnten.
Selbst unter diesen erweiterten Arten von Tweets, die Sie möglicherweise erhalten, gilt das Ranking-System des Algorithmus – Sie erhalten nicht alle Tweets, die Ihren Themen, Vorlieben und vorhergesagten Interessen entsprechen – Sie erhalten eine Liste, die durch den Algorithmus von Twitter kuratiert wird.
Ranking der Interessantheit
In der DNA einer Reihe von Patenten und Algorithmen von Twitter zum Ranking von Tweets steckt das Konzept der „Interessanz“.
Dies wurde höchstwahrscheinlich von einem 2006 an Yahoo erteilten Patent mit dem Titel „Interessanz-Ranking von Medienobjekten“ inspiriert, das die Ranking-Methoden beschrieb, die im Algorithmus für Flickr verwendet wurden (der dominierende Social-Media-Foto-Sharing-Dienst, der später von Instagram und Instagram in den Schatten gestellt wurde Pinterest).
Dieser frühere Algorithmus für Flickr weist viele Ähnlichkeiten mit den zeitgenössischen Patenten von Twitter auf. Es wurden ähnliche und sogar identische Faktoren zur Berechnung der Interessantheit verwendet. Diese enthielten:
- Standortinfo.
- Content-Metadaten.
- Chronologie.
- Benutzerzugriffsmuster.
- Signale von Interesse (z. B. Markieren, Kommentieren, Favoriten).
Man könnte den Algorithmus von Twitter leicht so beschreiben, dass er den Interessantheitsalgorithmus von Flickr übernimmt, einige der beteiligten Faktoren erweitert, ihn durch einen ausgeklügelteren maschinellen Lernprozess berechnet, Inhalte basierend auf der Verarbeitung natürlicher Sprache (NLP) interpretiert und eine Reihe zusätzlicher Variationen integriert Ermöglichen Sie eine schnelle Präsentation nahezu in Echtzeit für eine gigantische Anzahl von Benutzern gleichzeitig.
Twitter-Ranking und Spam
Es ist auch von Interesse, sich auf Methoden zu konzentrieren, die von Twitter verwendet werden, um Spam, Spam-Benutzerkonten zu erkennen und Spam-Tweets abzuwerten oder zu unterdrücken.
Die Überwachung von Desinformationen, anderen gegen die Richtlinien verstoßenden Inhalten und Belästigung ist ebenfalls intensiv, aber das stimmt nicht unbedingt so sehr mit Ranking-Bewertungen überein.
Einige der Spam-Erkennungspatente sind interessant, weil ich sehe, dass Benutzer häufig ziemlich unbeabsichtigt auf die Spam-Unterdrückungsprozesse von Twitter stoßen, und es gibt eine Reihe von Dingen, die man tun kann, die zu Sandbaging-Bemühungen führen, um das Twitter-Publikum zu fördern und mit ihm zu interagieren. Twitter musste aggressive Watchdog-Prozesse aufbauen, um Spam zu überwachen und zu entfernen, und selbst die prominentesten Benutzer können von Zeit zu Zeit mit diesen Prozessen in Konflikt geraten.
Daher kann es wichtig sein, die Spam-Faktoren von Twitter zu verstehen, da sie dazu führen können, dass die eigenen Tweets von der sonst üblichen Interessantheit abgezogen werden, und dieser Verlust der Relevanzwerte kann die Sichtbarkeit und Verbreitungskraft Ihrer Tweets verringern.
Twitter-Ranking-Faktoren
Welche Faktoren werden also in den Patenten von Twitter zur Bewertung von „Interesse“ erwähnt und welche beeinflussen, wie Twitter Tweets für Rankings bewertet?
Aktualität des Tweet-Postings
Wobei neuere im Allgemeinen viel bevorzugter sind. Abgesehen von bestimmten Schlüsselwörtern und anderen Suchtypen stammen die meisten Tweets aus den letzten Stunden. Einige "Falls du es verpasst hast"-Tweets können ebenfalls enthalten sein, die sich anscheinend hauptsächlich über die letzten ein oder zwei Tage erstrecken.
Bilder oder Videos
Im Allgemeinen haben Google und andere Plattformen angegeben, dass Nutzer dazu neigen, Bilder und Videomedien mehr zu bevorzugen, sodass ein Tweet, der beides enthält, möglicherweise eine höhere Punktzahl erhält.
Twitter zitiert insbesondere Bild- und Videokarten, was sich auf Websites bezieht, die Twitter-Karten implementiert haben, was es Twitter ermöglicht, auf einfache Weise reichhaltigere Vorschau-Snippets anzuzeigen, wenn Tweets Links zu Webseiten mit dem Karten-Markup enthalten.
Tweets mit Links, die Bilder und Videos zeigen, sind im Allgemeinen ansprechender für Benutzer, aber es kann einen zusätzlichen Vorteil für Tweets geben, die auf die Seiten mit dem Karten-Markup verlinken, um den Karteninhalt anzuzeigen
Interaktionen mit dem Tweet
Twitter nennt „Gefällt mir“-Angaben und Retweets, aber möglicherweise gelten hier auch zusätzliche Metriken im Zusammenhang mit dem Tweet. Zu den Interaktionen gehören:
- Likes
- Retweets
- Klicks auf Links, die möglicherweise im Tweet enthalten sind
- Klicks auf Hashtags im Tweet
- Klicks auf Twitter-Konten, die im Tweet erwähnt werden
- Detail Expands – Klicks, um Details über den Tweet anzuzeigen, z. B. um anzuzeigen, wem er gefallen hat oder wer ihn retweetet hat.
- Neue Follower – wie viele Personen sind über den Benutzernamen gefahren und haben dann geklickt, um dem Konto zu folgen.
- Profilbesuche – wie viele Personen auf den Avatar oder Benutzernamen geklickt haben, um das Profil des Posters zu besuchen.
- Shares – wie oft der Tweet über die Share-Schaltfläche geteilt wurde.
- Antworten auf den Tweet
Impressionen
Während die meisten Impressionen von der Anzeige des Tweets in Timelines stammen, werden einige Impressionen abgeleitet, wenn Tweets durch Einbetten in Webseiten geteilt werden. Es ist möglich, dass diese Impressionszahlen auch den Interessantheitswert für den Tweet beeinflussen.
Wahrscheinlichkeit von Wechselwirkungen
Ein Twitter-Patent beschreibt die Berechnung einer Punktzahl für einen Tweet, die darstellt, wie wahrscheinlich es ist, dass Follower des Tweet-Autors im Social-Messaging-System mit der Nachricht interagieren, wobei die Punktzahl auf der berechneten Interaktionsniveauabweichung zwischen dem beobachteten Interaktionsniveau von Followern von basiert der Autor und das erwartete Interaktionsniveau der Follower.
Länge des Tweets
Eine Art der Klassifizierung ist die Länge des im Tweet enthaltenen Textes, die als numerischer Wert klassifiziert werden könnte (z. B. 103 Zeichen) oder einer von mehreren Kategorien zugeordnet werden könnte (z. B. kurz, mittel oder lang). .
Je nachdem, um welche Themen es in einem Tweet geht, kann dieser als mehr oder weniger interessant bewertet werden – bei manchen Themen kann ein kurzer Tweet vorteilhafter sein, und bei einigen anderen Themen kann eine mittlere oder lange Länge den Tweet interessanter machen.
Interaktionen mit früheren Autoren
Frühere Interaktionen mit dem Autor eines Tweets erhöhen die Wahrscheinlichkeit (und den Ranking-Wert in der eigenen Timeline), dass man andere Tweets desselben Autors sieht.
Diese Social Graph-Interaktionsmetriken können eine Bewertung nach dem Ursprung der Beziehung umfassen.
Daher kann eine Vergangenheit des Antwortens, Likens oder Retweetens der Tweets eines Autors, selbst wenn man diesem Konto nicht folgt, die Wahrscheinlichkeit erhöhen, dass man seine neuesten Tweets sieht.
Es besteht die Möglichkeit, dass die jüngsten Interaktionen mit einem Tweet-Autor ebenfalls eine Rolle spielen. Wenn Sie also längere Zeit nicht mit einem seiner Tweets interagiert haben, kann die potenzielle Sichtbarkeit seiner neueren Tweets für Sie abnehmen.
Im Kontext des Algorithmus werden „Autor“ und „Konto“ im Wesentlichen gleichbedeutend verwendet, sodass Tweets von einem Unternehmenskonto genauso behandelt werden wie Tweets von einer Einzelperson.
Bewertung der Glaubwürdigkeit des Autors
Diese Punktzahl kann anhand der Beziehungen und Interaktionen eines Autors mit anderen Benutzern berechnet werden.
Das im Patent angegebene Beispiel ist, dass ein Autor, dem mehrere hochkarätige oder produktive Konten folgen, einen hohen Glaubwürdigkeitswert haben würde.
Während ein Bewertungswert „niedrig“, „mittel“ und „hoch“ genannt wird, schlägt das Patent auch eine Skala von Bewertungswerten von 1 bis 10 vor und kann einen qualitativen und/oder quantitativen Faktor beinhalten.
Ich würde vermuten, dass ein Bereich wie 1 bis 10 viel wahrscheinlicher ist. Es scheint wahrscheinlich, dass einige der Spam-Bewertungswerte verwendet werden könnten, um von einer Glaubwürdigkeitsbewertung des Autors abzuziehen. Mehr zu potenziellen Spam-Bewertungsfaktoren im letzten Teil dieses Artikels.
Autorenrelevanz
Es ist möglich, dass Autoren, die für ein bestimmtes Thema als relevanter eingestuft werden, einen höheren Autorenrelevanzwert haben. Außerdem kann die Erwähnung eines Autors ihn im Kontext der Tweets, in denen er erwähnt wird, relevanter machen.
Die Patente sprechen auch über die Zuordnung von Autoren zu Themen, sodass es möglich ist, dass Autoren, die häufig zu bestimmten Themen twittern, zusammen mit guten Interaktionsraten eine höhere Relevanz haben, wenn ihre Tweets dieses Thema betreffen.
Autorenmetriken
Tweets können basierend auf Eigenschaften des Autors klassifiziert werden. Diese Metriken können die relative Interessantheit der Nachrichten des Autors beeinflussen. Zu solchen Autorenmetriken gehören:
- Ort des Autors (z. B. Stadt oder Land)
- Alter (basierend auf dem Geburtsdatum, das in den Kontodetails angegeben werden kann)
- Anzahl der Follower
- Anzahl der Konten, denen der Autor folgt
- Verhältnis der Anzahl der Follower zu den Accounts, denen gefolgt wird, da eine größere Anzahl von Followern im Vergleich zu Gefolgten zusammen mit der reinen Follower-Zahl eine größere Popularität vermittelt. Ein Verhältnis, das näher bei 1 liegt, würde auf eine Gegenleistung hinweisen, die der Philosophie des Autors folgt, was es weniger möglich macht, auf Popularität zu schließen, und den Anschein einer künstlichen Popularität erweckt.
- Anzahl der vom Autor geposteten Tweets pro Zeitraum (z. B. pro Tag oder pro Woche).
- Alter des Kontos (z. B. Monate seit Kontoeröffnung) – bei Konten, die erst vor kurzem eingerichtet wurden, wird ein viel geringeres Gewicht beigemessen.
- Vertrauen.
Themen
Tweets werden nach den Themen klassifiziert, die sie betreffen. An der Klassifizierung der Tweets sind einige sehr ausgeklügelte Algorithmen beteiligt.
Twitter-Nutzer haben häufig Themen ausgewählt, die mit ihren Konten verknüpft werden sollen, und Ihnen werden offensichtlich beliebte Tweets zu den von Ihnen ausgewählten Themen angezeigt. Aber Twitter erstellt auch automatisch Themen basierend auf Schlüsselwörtern, die in Tweets gefunden werden.
Basierend auf Ihren Interaktionen mit Tweets und den Konten, denen Sie folgen, sagt Twitter auch Themen voraus, an denen Sie wahrscheinlich interessiert wären, und zeigt Ihnen einige Tweets aus diesen Themen, obwohl Sie die Themen nicht offiziell abonniert haben.
Phrasenklassifizierung
Das System von Twitter ist sehr komplex und ermöglicht die potenzielle Anwendung benutzerdefinierter Ranking-Modelle auf Tweets für bestimmte Themen und wenn bestimmte Phrasen vorhanden sind.
Twitter hat eine große Belegschaft, die daran arbeitet, Modelle für bestimmte „Kundenreisen“ zu entwickeln, und dies scheint mit Patentbeschreibungen übereinzustimmen, wie Redakteure Regeln für themenorientierte Posts und Schlüsselwörter oder Phrasen in Posts festlegen könnten.
Zum Beispiel könnten Posts mit Texten wie „jetzt eingestellt“ oder „wird im Fernsehen laufen“ für ein Thema als langweilig angesehen werden, während Ausdrücke wie „frisch“, „im Angebot“ oder „nur heute“ möglicherweise mehr Gewicht erhalten als sie dürfte interessanter werden.
Dies könnte ziemlich schwierig zu erfüllen sein, da es ein riesiges Feld potenzieller Themen und benutzerdefinierter Gewichtungen gibt, die angewendet werden könnten.
Eine aktuelle Stellenausschreibung auf Twitter für einen Produktdesigner, Customer Journey, beschrieb, wie die Position helfen würde:
„Ob Sie nach Ariana Grande-Fanart, #herpetology oder extremem Einradfahren suchen, auf Twitter passiert alles. Unser Team ist dafür verantwortlich, neuen Mitgliedern dabei zu helfen, sich in den vielfältigen öffentlichen Gesprächen auf Twitter zurechtzufinden und schnell ein Zugehörigkeitsgefühl zu finden…“
„Sammeln Sie Erkenntnisse aus Daten- und qualitativer Forschung, entwickeln Sie Hypothesen, skizzieren Sie Lösungen mit Prototypen und testen Sie Ideen mit unserem Forschungsteam und in Experimenten.“
„Dokumentieren Sie detaillierte Interaktionsmodelle und UI-Spezifikationen.“
„Erfahrung im Entwerfen für maschinelles Lernen, umfangreiche Taxonomien und/oder Interessendiagramme.“
Diese Beschreibung klingt sehr ähnlich zu dem, was in Twitters Patent für „System und Methode zur Bestimmung der Relevanz sozialer Inhalte“ beschrieben wird, wo:
„Redakteure könnten Regeln aufstellen, um bestimmte Phrasen als mehr oder weniger interessant zu klassifizieren …“
„…ein Redakteur kann entscheiden, dass einige Phrasen und Attribute in allen Inhalten interessant sind, unabhängig von der Kategorie des Ortes, der den Inhalt verfasst. Beispielsweise kann der Ausdruck „im Angebot“ oder „Veranstaltung“ in allen Fällen interessant sein und positiv gewichtet werden.“
Ein Patent beschreibt, wie Tweets, die mit kommerzieller Sprache erkannt wurden, eine niedrigere Punktzahl zugewiesen werden konnten als Tweets ohne kommerzielle Sprache. (Im Gegensatz dazu könnten solche Gewichtungen umgedreht werden, wenn der Benutzer Suchen durchführte, die darauf hindeuteten, dass er etwas kaufen wollte, sodass Tweets, die kommerzielle Sprache enthielten, eine höhere Gewichtung erhalten könnten.)
Uhrzeit
Die Tageszeit kann verwendet werden, um die Relevanz zu beeinflussen. Beispielsweise könnte eine Regel implementiert werden, um Tweets, in denen „Kaffee“ zwischen 8:00 und 10:00 Uhr erwähnt wird, und/oder Tweets, die von Cafés gepostet werden, mehr Gewicht zu verleihen.
Standorte
Patente beschreiben, wie „Ortsreferenzen“ in Tweets Tweets über einen Ort und/oder Konten, die mit der Ortsreferenz verknüpft sind, größeres Gewicht verleihen könnten als andere Konten, die den Ort lediglich erwähnen. Auch die geografische Nähe zwischen dem Standort des Geräts eines Benutzers und dem Standort, der mit Inhaltselementen (Text, Bild, Video und/oder Autor des Tweets) verknüpft ist, kann die potenzielle Relevanz erhöhen oder verringern.
Sprache
Die Sprache des Tweets kann klassifiziert werden (z. B. Englisch, Französisch usw.).
Die Sprache kann unter Verwendung verschiedener automatisierter Sprachbewertungstools automatisch bestimmt werden.
Ein Tweet in einer bestimmten Sprache wäre für Sprecher der Sprache von größerem Interesse und für andere weniger interessant.
Antwort-Tweets
Tweets können danach klassifiziert werden, ob sie Antworten auf frühere Tweets sind. Ein Tweet, der eine Antwort auf einen früheren Tweet ist, kann als weniger interessant erachtet werden als ein Tweet zu einem neuen Thema.
In einer Patentbeschreibung könnte das Thema eines Tweets bestimmen, ob der Tweet dazu bestimmt ist, einem anderen Konto angezeigt zu werden oder in die Nachrichtenströme anderer Konten aufgenommen zu werden.
Wenn du deine Chronik ansiehst, gibt es Fälle, in denen einige Antworten auf einen Tweet auch mit dem Haupt-Tweet angezeigt werden – beispielsweise wenn die Antwort-Tweets von Accounts gepostet werden, denen du folgst. In den meisten Fällen sind die Antwort-Tweets nur sichtbar, wenn man auf den Thread klickt oder auf den Tweet klickt, um alle Antworten anzuzeigen.
„Gesegnete“ Konten
Dies ist ein seltsames Konzept, von dem ich glaube, dass es möglicherweise nicht in Produktion ist.
Twitter beschreibt gesegnete Konten als innerhalb des Diagramms einer bestimmten Konversation identifiziert, wobei der ursprüngliche Autor in einer Konversation als „gesegnet“ gelten würde, und aus den nachfolgenden Antworten auf den ursprünglichen Beitrag jede der Antworten, auf die anschließend von geantwortet wird gesegnetes Konto wird ebenfalls „gesegnet“.
Diese Tweets, die von gesegneten Konten in der Konversation gepostet wurden, würden erhöhte Relevanzbewertungen erhalten.
Website-Profil
Dies wird in Twitter-Patenten nicht erwähnt, aber es macht im Zusammenhang mit all den anderen Faktoren, die sie erwähnt haben, zu viel Sinn, um darauf zu verzichten.
Die Links vieler großer Content-Websites werden häufig auf Twitter geteilt, und Twitter könnte leicht einen Reputations-/Beliebtheitswert für das Website-Profil erstellen, der auch in die Rangfolge von Tweets einfließen könnte, wenn Links zu Inhalten auf den Websites gepostet werden.
Nachrichtenseiten, Informationsquellen, Unterhaltungsseiten – all diese könnten Punktzahlen haben, die aus den gleichen Faktoren entwickelt wurden, die zur Bewertung von Twitter-Konten verwendet werden. Tweets von Websites, die besser gefallen und mit denen man besser interagiert, könnte ein größeres Gewicht beigemessen werden als relativ unbekannte Websites, mit denen weniger interagiert wird.
Twitter verifiziert
Ja, wenn Sie vermutet haben, dass das blaue Abzeichen neben Benutzernamen eine bevorzugte Behandlung vermittelt, gibt es in einem der Twitter-Patente spezifische Formulierungen, die bestätigen, dass sie dies zumindest in Betracht gezogen haben.
Da mit verifizierten Konten oft bereits verschiedene andere Beliebtheitsindikatoren verknüpft sind, ist nicht ohne weiteres ersichtlich, ob dieser Faktor verwendet wird oder nicht. Tweets, die von einem verifizierten Konto gepostet werden, können eine höhere Relevanzbewertung erhalten, sodass sie mehr angezeigt werden als Tweets von unverifizierten Konten.
Hier die Patentbeschreibung:
„In einer oder mehreren Ausführungsformen der Erfindung umfasst das Konversationsmodul ( 120 ) eine Funktionalität zum Anwenden eines Relevanzfilters zum Erhöhen der Relevanzbewertungen eines oder mehrerer Autorenkonten des Konversationsgraphen, die in einer Whitelist verifizierter Konten identifiziert sind. Beispielsweise kann die Whitelist verifizierter Konten eine Liste von Konten sein, bei denen es sich um hochkarätige Konten handelt, die anfällig für Identitätsdiebstahl sind. In diesem Beispiel würden Prominenten- und Geschäftskonten von der Messaging-Plattform (100) verifiziert, um Benutzer der Messaging-Plattform (100) zu benachrichtigen, dass die Konten authentisch sind. In einer oder mehreren Ausführungsformen der Erfindung ist das Konversationsmodul (120) so konfiguriert, dass es die Relevanzbewertungen verifizierter Autorenkonten um einen vordefinierten Betrag/Prozentsatz erhöht.“
Hat Tendenz
Dies ist ein binäres Flag, das angibt, ob der Tweet als Thema identifiziert wurde, das zum Zeitpunkt der Übertragung der Nachricht im Trend lag.
App hat Geschlecht, sexuelle Orientierung und Interessen erkannt
Twitter kann möglicherweise die Mobilgeräteinformationen eines Kontoinhabers verwenden, um auf das Geschlecht des Kontoinhabers oder Interessen an Themen wie Nachrichten, Sport, Krafttraining und anderen Themen zu schließen.
Einige Mobilgeräte stellen Informationen zu anderen Apps bereit, die auf dem Telefon geladen sind, um mögliche Konflikte bei der Anwendungsprogrammierung zu diagnostizieren. Daher könnten einigen Tweets, die Ihrem Geschlecht, Ihrer sexuellen Orientierung und Ihren aktuellen Interessen entsprechen, mehr Interessantheitspunkte gegeben werden, einfach basierend auf Schlussfolgerungen aus den Apps Ihres Telefons. (Siehe: https://screenrant.com/android-apps-collecting-app-data/ )
Und mehr Ranking-Faktoren
Twitter gibt an, dass:
„Unsere Liste der berücksichtigten Merkmale und ihrer vielfältigen Wechselwirkungen wächst ständig und informiert unsere Modelle über immer nuanciertere Verhaltensmuster.“
Diese Liste von Faktoren ist also wahrscheinlich eine Unterrepräsentation der Faktoren, die sie möglicherweise verwenden, und ihre Liste kann erweitert werden.
Stellen Sie sich auch vor, dass eine benutzerdefinierte Kombination einiger der oben genannten Faktoren als Modelle für Tweets zu bestimmten Themen angewendet werden kann, was den Rankings durch maschinelle Lernmethoden eine große potenzielle Komplexität verleiht. (Auch hier ist das maschinelle Lernen, das angewendet wird, um Ranggewichtungsmodelle zu erstellen, die für bestimmte Suchanfragen oder Themen angepasst sind, Methoden sehr ähnlich, die wahrscheinlich bei Google verwendet werden.)
Twitter hat erklärt, dass die Bewertung von Tweets jedes Mal erfolgt, wenn man Twitter besucht, und jedes Mal, wenn man seine Timeline aktualisiert. In Anbetracht einiger der beteiligten komplexen Faktoren ist das sehr schnell!
Twitter verwendet A/B-Tests der Gewichtung von Ranking-Faktoren und andere Algorithmusänderungen und bestimmt, ob eine vorgeschlagene Änderung eine Verbesserung darstellt, basierend auf dem Engagement und der Zeit, in der ein Tweet angezeigt/mit ihm interagiert wird. Dies wird verwendet, um Ranking-Modelle zu trainieren.
Die Einbeziehung von maschinellem Lernen in diesen Prozess legt nahe, dass Ranking-Modelle für viele spezifische Szenarien und möglicherweise spezifisch für bestimmte Themen und Benutzertypen erstellt werden könnten. Nach der Entwicklung kann das Modell getestet werden, und wenn es das Engagement verbessert, kann es schnell für alle Benutzer eingeführt werden.
Wie Vermarkter diese Informationen nutzen können
Es gibt viele Schlussfolgerungen, die aus der Liste der potenziellen Ranking-Faktoren gezogen werden können und die von Vermarktern verwendet werden können, um ihre Tweeting-Taktiken zu verbessern.
Ein Twitter-Konto, das nur Ankündigungen zu seinen Produkten und Werbeinformationen über sein Unternehmen veröffentlicht, wird wahrscheinlich nicht so viel Sichtbarkeit haben wie Konten, die interaktiver mit ihrer Community sind, da Interaktionen mehr Ranking-Signale und potenzielle Vorteile erzeugen.
Social-Media-Experten empfehlen seit langem einen Ansatz, bei dem Posttypen gemischt werden, anstatt nur selbstreferenzielle Werbung zu veröffentlichen – diese Strategien umfassen „Die Drittel-Regel“, „Die 80/20-Regel“ und andere.
Die Twitter-Ranking-Faktoren stützen wahrscheinlich diese Theorien, da es wahrscheinlicher ist, die Sichtbarkeit eines Kontos zu erhöhen, wenn mehr Interaktionen mit einer Anzahl von Twitter-Nutzern ausgelöst werden.
Beispielsweise könnte ein großes Unternehmenskonto mit vielen Followern eine interessante Umfrage veröffentlichen, um Ratschläge zu erhalten, welche Funktionen zu seinem Produkt hinzugefügt werden sollten. Die von den Benutzern geposteten Stimmen und Kommentare sorgen dafür, dass die Befragten aufgrund der jüngsten Interaktionen mit größerer Wahrscheinlichkeit den nächsten Beitrag des Unternehmens sehen und dass der nächste Beitrag etwas Neues fördern oder ankündigen könnte. Und die Follower der Befragten sehen möglicherweise auch eher den nächsten Beitrag des Unternehmens, da Twitter anscheinend berücksichtigt, dass Benutzer mit ähnlichen Interessen möglicherweise offener dafür sind, Inhalte zu sehen, die ihren Interessen entsprechen.
Außerdem weisen die Faktoren auf eine Reihe potenziell vorteilhafter Ansätze hin.
Wenn Sie einen Tweet posten, der für ein Produkt wirbt oder eine Ankündigung macht, könnte das Kombinieren von etwas, um eine Antwort von Ihren Followern hervorzurufen, die Präsenz auf der Plattform leicht erhöhen, da die Antworten jedes Befragten auf Ihren Tweet die Chancen erhöhen können, dass ihre direkten Follower den ursprünglichen Tweet und ihre sehen Antwort-Tweet von Connection.
Die Nutzung des Social Graph-Aspekts des Twitter-Algorithmus kann dazu beitragen, die Interessantheit Ihrer Tweets zu erhöhen und die Sichtbarkeit Ihrer Tweets für andere Benutzer zu erhöhen.
Spam-Faktoren können sich negativ auf Tweet-Rankings auswirken
Spam-Erkennungsalgorithmen können sich negativ auf die Ranking-Fähigkeit von Tweets auswirken.
Zum einen ist Twitter sehr schnell dabei, Konten zu sperren, die eklatant spammen, und in Fällen, in denen es offensichtlich und eindeutig ist, kann man damit rechnen, dass das Konto abrupt gekündigt wird, wodurch alle seine Tweets aus den Konversationsdiagrammen und Zeitleisten verschwinden, und wodurch das Kontoprofil nicht mehr zur Ansicht verfügbar ist.
In noch anderen Fällen, in denen nicht so klar ist, ob ein Konto spammt, könnten die Tweets des Kontos einfach durch die Anwendung negativer Ranggewichtungswerte herabgestuft werden, oder die Tweets könnten gesperrt oder ausgesetzt werden, bis oder wenn der Kontoinhaber eine Korrekturmaßnahme ergreift oder überprüft ihre Identität.
Beispielsweise könnte ein Twitter-Konto mit einer langen Geschichte guter Tweets plötzlich damit beginnen, Viagra-Anzeigen oder Links zu Malware zu posten, beispielsweise wenn ein etabliertes Konto gehackt wurde. Twitter kann das Konto vorübergehend sperren, bis Korrekturmaßnahmen ergriffen wurden, z. B. das Bestehen einer CAPTCHA-Bestätigung oder das Empfangen eines Bestätigungscodes über das Mobiltelefon und das Ändern von Passwörtern. Ein weiteres Beispiel könnte ein neuer Benutzer sein, der versehentlich eine bestimmte Schwelle überschreitet, indem er innerhalb eines kurzen Zeitraums zu vielen Konten folgt oder etwas zu häufig postet.
Twitter setzt eine Reihe von Methoden ein, um Spam zu erkennen und auszublenden, damit Benutzer ihn weniger sehen.
Ein Großteil der automatisierten Erkennung beruht auf der Erkennung einer Kombination aus Kontoprofilmerkmalen, Tweetverhalten des Kontos und Inhalten, die in den Tweets des Kontos gefunden werden.
Twitter hat eine Reihe charakteristischer „Fingerabdrücke“ von Spam entwickelt, um eine schnelle Mustererkennung durchzuführen. Ein Twitter-Patent beschreibt, wie:
„Spam wird bestimmt, indem die Merkmale identifizierter Spam-Konten verglichen werden und ein „Ähnlichkeitsdiagramm“ erstellt wird, das mit anderen Konten verglichen werden kann, die im Verdacht stehen, Spam zu sein.“
Tweets, die potenziell Spam enthalten, könnten mit einem binären Wert wie „Ja“ oder „Nein“ gekennzeichnet werden, und dann können gekennzeichnete Tweets aus Zeitleisten herausgefiltert werden.
Es ist ebenso möglich, dass es eine Skala von Spam gibt, die aus mehreren Faktoren berechnet wird, und sobald ein Tweet oder Konto einen Schwellenwert überschreitet, wird es herabgestuft. Ich denke, es lohnt sich, diese zu erwähnen, da Twitter-Nutzer die Auswirkungen der Nutzung der Plattform möglicherweise nicht verstehen. Beispielsweise kann sich das Posten eines übermäßig aggressiven Tweets für einige Zeit negativ auf die nachfolgenden Tweets eines Kontos auswirken. Wiederholtes nervöses Verhalten kann zu Schlimmerem führen, z. B. zur vollständigen Löschung des Kontos, ohne dass eine Wiederherstellung möglich ist.
Ich werde hier einige Faktoren hinzufügen, die nicht ausdrücklich in Twitter-Patenten oder Blog-Beiträgen erwähnt werden, da Twitter aus offensichtlichen Gründen nicht alle Spam-Identifizierungsfaktoren offenlegt. Einige Merkmale von Spam und Spam-Konten scheinen jedoch so offensichtlich zu sein, dass ich einige aus persönlichen Beobachtungen oder aus angesehenen Forschungsquellen hinzufüge, um ein breiteres Verständnis dafür zu vermitteln, was zu Spam-Herabstufungen führen kann.
Spam-Faktoren und andere negative Ranking-Faktoren
- Tweets, die eine kommerzielle Nachricht enthalten, die ohne Follower/Followee-Beziehung oder in einer unidirektionalen Beziehung gepostet wird (der Autor des Tweets folgt dem Konto, das er erwähnt, aber das empfangende Konto folgt dem Autor nicht), aber sie hatten keine vorherigen Interaktionen, beginnen zu erscheinen verdächtig. Wenn dies viele Male mit ähnlichem oder identischem Text geschieht, wird es nicht lange dauern, bis dies als Spam-Aktivität angesehen wird, insbesondere bei neueren Konten.
- Kontoalter – wobei das Alter zeigt, dass das Konto erst vor kurzem eingerichtet wurde. (Die jüngsten Untersuchungen von SparkToro zu Twitter-Spam legen ein Kontoalter von 90 Tagen oder weniger nahe.)
- NSFW-Flag des Kontos – Das Konto hat ein Flag, das anzeigt, dass es für Links zu Websites identifiziert wurde, die in einer schwarzen Liste potenziell anstößiger Websites dokumentiert sind (z. B. Websites mit Pornos, expliziten Materialien, Gore usw.).
- Anstößige Markierung – der Tweet enthält einen oder mehrere Begriffe aus einer schwarzen Liste anstößiger Begriffe.
- Potentially Fake Account – the account is suspected of impersonating a real person or organization, and has not been verified.
- Account Posting Frequent Copyright Infringement
- Blacklisting – One patent suggests use of a blacklist that will apply a relevance filter to decrease the relevance scores of accounts that can include but are not limited to: spammers, potentially fake accounts, accounts with a potential or history of posting adult content, accounts with a potential or history of posting illegal content, accounts flagged by other users, and/or meeting any other criteria for flagging accounts.
- Account Bot Flag – identifying that the account broadcasting the Tweet has been IDed as potentially being operated by a software application instead of by a human. This particular criteria has a number of implications involved, particularly for those accounts that have used types of scheduling applications for posting Tweets, or other software that generates automated Tweets. For instance, scheduling too many Tweets to be posted per time period through an app like Hootsuite or Sprout Social can result in the user account getting suspended, or its app access via the Twitter API to get suspended. This can be particularly galling, as if the same number of Tweets per time period were posted manually, the account would not run into issues. There has long been a believe among marketers on Facebook as well as Twitter that the respective algorithms might dumb-down visibility for posts published through software versus via manually, and this component suggests that that very well could be the case with Twitter.
- Tweets containing offensive language might be allowed to erode their interestingness score.
- Tweets posted via Twitter's APIs, such as through social media management tools that rely upon Twitter's API, are generally subject to greater scrutiny as Twitter has described “The problem may be exacerbated when a content sharing service opens its application programming interface (API) to developers.” My observation is that accounts that rely solely upon third-party posting applications and APIs – particularly newer accounts – may see their distribution ability somewhat sandbagged. Newer accounts should work to become established through human usage for an initial period before relying more upon scheduling and posting applications, and even established accounts may see greater distribution potential if they mix some human manual posting in combination with their scheduled/automated/third-party-application posts.
- Accounts Dormant for a Long Period – Accounts that have not posted for a long time, and then suddenly spring to life do not immediately have the ranking ability they otherwise might. The reason for this is that spammers sometimes may successfully hijack inactive accounts in order to subvert a previously bona fide account into posting spam.
- Device Profile Associated With Spammer or Other Policy Violator – Essentially, patents suggest that Twitter is using Browser Fingerprinting and Device Fingerprinting to detect spammers and other bad players. Fingerprinting enables tech services to generate profiles of a combo of data that would include things like IP address, device ID, user agent, browser plugins, device platform model and version, and app downloads to create unique “fingerprints” to identify specific devices. A major takeaway from this is that if you have two or more Twitter accounts you use with your phone or browser, if you perform abusive Tweeting through one of those accounts, there is the very real possibility that it could impair rankings in a more “professional” account you operate on the same device. In a worst-case scenario, it could even get you locked-out of both accounts for what you may do on one. This has pretty serious implications for companies and agencies that have employees conducting professional Tweets, while they may switch on their device to posting personal Tweets as well. Some types of Tweets that could cause issues would include: Spam, Harassment, False or Misleading Info, Threats, repeated Copyright Infringement, posting Malware links, and likely more. While I theorize that a personal account could also get a professional account suspended on the same device, I would hazard a guess that it might only suspend the professional account for that particular device holder, and the professional account could be subsequently accessed through a different device.
- Lack of other app usage data – It is very possible that Twitter may be able to receive data from mobile devices that indicates if the device operator has downloaded or recently used other apps on the device beyond just the Twitter app. (See: https://screenrant.com/android-apps-collecting-app-data/ ) A common spam account characteristic is that they do not reflect other app usage because the device is primarily dedicated to spamming Twitter and is not showing human usage characteristics. Or, the account is hosted on a webserver instead of a mobile device, and is attempting to imitate the usage profile of a human user.
- Blocks – accounts that other users have blocked numerous times, or accounts that have been blocked over a particular time frame can be indicative of a spam account.
- Frequency of Tweets – if a number of Tweets sent from the same account in a given time frame exceeds a threshold amount, then that account may be flagged as spam and denied from sending subsequent Tweets. This is not a hard-and-fast rule, or it is variable in application, because there are larger, corporate accounts with many staff members handling posting of Tweets to a large customer base, such as in the case of American Airlines. There are accounts such as this which are added to whitelists to avoid automatic suspension due to the large volumes of Tweets they may post within short time frames.
- High Volume of Tweets with the Same Hashtag or Mentions of the Same @Username – Obviously, high-volume Tweets are risky, and increasing your volume within short timeframes will inch your account closer and closer to being deemed to be that of a spammer. Thus, attempting to overwhelm the timeline of a particular Hashtag will be deemed to be annoying and potentially spammy. Likewise, insisting upon gaining the attention of a particular account by mentioning them repeatedly will begin to appear annoying, unnecessary, abusive harassment, and/or spammy.
- CAPTCHA – If suspected of spam, the service may prevent a Tweet from being written-to or published, requiring the user account to first pass a CAPTCHA challenge to establish that the account is operated by a human. (My agency has encountered this as we have set up new accounts on behalf of clients. This is more likely to happen when the computer that is used to set up the account has been used recently to set up other accounts, and the account is set up using free email service accounts instead of through mobile phones. Twitter also often requires sending a mobile text message to confirm a phone number before unblocking the account.)
- Account Signup Reflects Anomoly – New accounts are exposed to greater scrutiny and suspicion within Twitter's systems, and one way of critiquing new accounts is based upon data associated with the initial account signup, since spammers have used automation to try to create large volumes of new accounts for bot usage. Twitter usage can reflect real account setups, or false ones, so Twitter has analyzed many false accounts and has developed fingerprint types of patterns to detect likely spam/bot accounts. For instance, when a human user accesses Twitter's account signup page in a browser window, to submit registration info, the browser will rapidly make calls back to Twitter's servers for dozens of elements that are used in composing the page in the browser – such as for Javascripts, cascading stylesheets, and images. Bots are more likely to submit registration info without first calling all the registration page elements. So, image requests and other filetype requests preceding a registration submission can be used to determine whether a new signup reflects an anomaly indicating a bot-generated signup has occurred. Thus, accounts signed-up with anomalous characteristics may have their Tweets deducted some in relevancy.
- Bulk-Follow of Verified Accounts – Spam accounts will often bulk-follow prominent and/or Verified accounts in order to establish a foothold in the social graph. When setting up a Twitter account for a real, human user before, we used to follow a handful of the Verified accounts suggested by Twitter during the signup process. Oddly enough, this behavior alone can cause an account to get suspended until a CAPTCHA or other verification is passed. So, the takeaway here is do not follow all that many accounts suggested to you in the signup process if you are setting up a new account. Definitely do not use one of those automated follow services that people used to use a lot years ago, or your account could get downgraded in relevancy or suspended.
- Few Followers – Spam accounts are often newer, and because they often do not promote themselves in ways beneficial to the community they inspire very few followers. So, a low follower account can be one factor in combination with others to identify a potentially spammy user.
- Irrelevant Hashtags in Reply Tweets – Hashtags in Tweets that do not involve the original Tweet's topic.
- Tweets Containing Affiliate Links – self explanatory.
- Frequent Requests to Befriend Users in a Short Time Frame
- Reposting Duplicate Content Across Multiple Accounts – Especially duplicate content posted close in time.
- Accounts that Tweet Only URLs
- Posting Irrelevant or Misleading Content to Trending Topics/Hashtags
- Erroneous or Fictitious Profile Location – For example, a profile location showing “Poughkeepsie, NY”, but the user's IP is China, would produce an apparent mismatch indicating a potential scammer or spammer account.
- Account IP Address Matching Abuser Account Ranges, or Country Locations that Originate Greater Amounts of Abuse – For example, Russia. Likewise, commonly known proxied IP addresses are easily detectable by Twitter, and are flagged as suspect.
- Default Profile Image – Human users are more likely to set up customized account images (“avatars”), so not setting one up and continued use of Twitter's default profile image is a red flag.
- Duplicated Profile Image – A profile image duplicated across many accounts is a red flag.
- Default Cover Image – Failure to set up a custom cover image in the profile's masthead is not as suspicious as continued use of a default profile image, but use of a different masthead image is more representative of a real account.
- Nonresolving URL in Profile – SparkToro suggests this, and it does align with many spam accounts. Sometimes this is because spammers may be more likely to set up websites that are likely to be suspended, or typosquatting domains intended to create Trojan horse websites which can also get suspended.
- Profile Descriptions Matching Spammer Keywords/Patterns
- Display Usernames Conform To Spam Patterns – Usernames that are meaningless alphanumeric sequences, or proper names followed by multiple numeric digits reflect a lack of imagination upon the part of spammers who may be attempting to register hundreds of accounts in bulk, with each name generated randomly, or each username generated by adding the next number in a sequence. Example: John32168762 is the sort of username that most humans find undesirable.
- Patterns – Profile and Tweet patterns used by spammers often reveal spammer accounts. For instance, if numbers of accounts with default Twitter profile pics and similar patterned display usernames all Tweet out links to a particular page or domain, those accounts all become extremely easy to identify and sideline.
Simply listing out spam identification factors sharply understates Twitter's sophisticated systems used for spam identification and spam management.
Major Silicon Valley tech companies have often fought spam for years now, and it has been described as a sort of arms race.
The tech company will create a method to detect the spam, and the spammers then evolve their processes to elude detection, and then the cycle repeats again, and again.
Abschließend
Twitter's patents illustrate a huge sophistication in terms of employing components of Artificial Intelligence, social graph analysis, and methods that combine synchronous and asynchronous processing in order to deliver content extremely rapidly.
The AI components include:
- Neural networks.
- Natural language processing.
- Circumflex calculation.
- Markov modeling.
- Logistic regression.
- Decision tree analysis.
- Random forest analysis.
- Supervised and unsupervised machine learning.
As the ranking determinations can be based upon unique, abstracted, machine learning models according to specific phrases, topics, and interest profiling, what works for one area of interest may work a little differently for other areas of interest.
Even so, I think that looking at these many potential ranking factors that have been described in Twitter patents can be useful for marketers who want to attain greater exposure on Twitter's platform.
Author's disclosure
I served this year as an expert witness in arbitration between a company that sued Twitter for unfair trade practices, and the case was amicably settled recently.
As an expert witness, I am often privy to secret information, including private communications such as employee emails within major corporations, as well as other key documents that can include data, reports, presentations, employee depositions and other information.
In such cases, I am bound by legal protective orders and agreements not to disclose information that was revealed to me in order to be sufficiently informed on the matters I am asked to opine upon, and this was no exception.
I have not disclosed any information covered by the protective order in this article from my recently-resolved case.
I have gained a greater understanding and insights into some aspects of how Twitter functions from context, observations of Twitter in public use, logical projections based on their various algorithm descriptions and from reading Twitter's patents and other public disclosures subsequent to the resolution of the case I served upon, including the following sources:
- Identifizieren relevanter Nachrichten in einem Konversationsdiagramm
- Bereitstellung von Inhalten zur Ausstrahlung über eine Nachrichtenplattform
- Förderung von Inhalten in einer Echtzeit-Messaging-Plattform
- System und Verfahren zur Bestimmung der Relevanz sozialer Inhalte
- Systeme und Verfahren zum Aufbau oder zur Aufrechterhaltung eines personalisierten vertrauenswürdigen sozialen Netzwerks
- Anzeigen relevanter Nachrichten eines Konversationsdiagramms
- Suchinfrastruktur
- Sichtbarkeitsfilterung
- Priorisierung von Nachrichten innerhalb eines Nachrichtennetzwerks
- Anwendungsgraph-Generator
- Einsatz von Deep Learning im großen Maßstab in den Timelines von Twitter
- Mehrstufige Anti-Spam-Systeme und -Methoden
- Erkennen von geskripteten oder anderweitig anomalen Interaktionen mit der Social-Media-Plattform
- Wie Twitter Spam und böswillige Automatisierung bekämpft
- Gesperrte Konten im Rückblick: Eine Analyse von Twitter-Spam
- Twitter-Analyse: 19,42 % der aktiven Konten sind gefälscht oder Spam
Die in diesem Artikel geäußerten Meinungen sind die des Gastautors und nicht unbedingt Search Engine Land. Mitarbeiter Autoren sind hier aufgelistet.

