Faktor peringkat algoritme Twitter: Panduan definitif

Diterbitkan: 2022-07-01

Paten Twitter dan publikasi lainnya mengungkapkan kemungkinan aspek bagaimana tweet dipromosikan di feed timeline pengguna.

Beberapa faktor peringkat timeline Twitter sangat mengejutkan, dan menyesuaikan pendekatan Anda terhadap Tweeting dapat membantu Anda mendapatkan visibilitas Tweet yang lebih besar.

Berdasarkan sejumlah paten kunci dan sumber lain, saya telah menguraikan sejumlah kemungkinan faktor peringkat untuk algoritma Twitter di sini.

Garis waktu Twitter

Twitter pertama kali mulai menggunakan timeline berbasis algoritme pada tahun 2016 ketika beralih dari apa yang murni umpan kronologis Tweet dari semua akun yang diikuti. Perubahan tersebut memberi peringkat pada garis waktu pengguna untuk memungkinkan mereka melihat “Tweet terbaik terlebih dahulu.” Twitter telah bereksperimen dengan variasi ini hingga saat ini.

Algoritma berbasis feed untuk media sosial bukanlah hal yang aneh. Facebook dan platform media sosial lainnya telah melakukan hal yang sama.

Alasan perubahan ini pada campuran algoritmik dari Tweet timeline cukup jelas. Garis waktu kronologis yang murni pribadi yang terdiri dari hanya akun yang telah diikuti sangat tertutup dan oleh karena itu terbatas – sementara memperkenalkan pos dari akun di luar koneksi langsung seseorang berpotensi meningkatkan waktu yang dihabiskan seseorang di platform, yang pada gilirannya meningkatkan kekakuan secara keseluruhan, yang pada gilirannya meningkatkan nilai layanan bagi pengiklan dan mitra data.

Berbagai klasifikasi minat pengguna dan topik minat yang terkait dengan akun dan tweet mereka selanjutnya memungkinkan potensi penargetan iklan berdasarkan demografi pengguna dan topik konten.

Pengguna kekuatan Twitter mungkin telah mengembangkan beberapa intuisi tentang berbagai faktor Tweet yang dapat menghasilkan visibilitas yang lebih besar dalam algoritme.

Pengingat tentang paten

Korporasi mendaftarkan paten sepanjang waktu untuk penemuan yang sebenarnya tidak mereka gunakan dalam layanan langsung. Ketika saya bekerja di Verizon, saya secara pribadi menulis sejumlah draf paten untuk berbagai penemuan yang saya dan rekan saya kembangkan selama pekerjaan kami – termasuk hal-hal yang pada akhirnya tidak kami gunakan dalam produksi.

Jadi, fakta bahwa Twitter memiliki paten yang menyebutkan gagasan tentang bagaimana segala sesuatu dapat bekerja sama sekali tidak menjamin bahwa begitulah cara kerjanya .

Juga, paten biasanya mengandung beberapa perwujudan, yang pada dasarnya adalah berbagai cara di mana sebuah penemuan dapat diimplementasikan – paten berusaha untuk menggambarkan elemen kunci dari sebuah penemuan seluas mungkin untuk mengklaim setiap kemungkinan penggunaan yang dapat dikaitkan dengannya.

Terakhir, seperti halnya paten algoritma PageRank yang terkenal yang merupakan dasar dari mesin pencari Google, dalam kasus di mana Twitter telah menggunakan perwujudan dari salah satu paten mereka, kemungkinan besar mereka telah mengubah dan menyempurnakan penemuan sederhana dan luas yang dijelaskan, dan akan terus melakukannya.

Terlepas dari semua ketidakjelasan dan ketidakpastian yang khas ini, saya menemukan sejumlah konsep yang sangat menarik dalam deskripsi paten Twitter, banyak di antaranya sangat mungkin untuk dimasukkan ke dalam sistem mereka.

Twitter dan Pembelajaran Mendalam

Satu peringatan tambahan sebelum saya melanjutkan melibatkan bagaimana algoritma timeline Twitter telah memasukkan Deep Learning ke dalam DNA-nya, ditambah dengan berbagai tingkat pengawasan manusia, menjadikannya binatang yang sering, jika tidak terus-menerus, berevolusi sendiri.

Ini berarti bahwa baik perubahan besar maupun kecil, perubahan inkremental, dapat dan akan terjadi dalam cara kinerja peringkat konten. Lebih lanjut, pendekatan pembelajaran mesin ini dapat menyebabkan kondisi di mana insinyur manusia Twitter sendiri mungkin tidak secara langsung tahu persis mengapa beberapa konten ditampilkan atau mengungguli konten lain karena abstraksi model peringkat yang dihasilkan, mirip dengan apa yang saya jelaskan saat menulis tentang model yang diproduksi oleh Google. peringkat kualitas melalui pembelajaran mesin.

Terlepas dari kerumitan dan kecanggihan cara kerja algoritme Twitter, memahami faktor-faktor yang kemungkinan masuk ke kotak hitam masih dapat mengungkapkan apa yang memengaruhi peringkat.

Garis waktu asli Twitter hanya terdiri dari semua Tweet dari akun yang telah diikuti seseorang sejak kunjungan terakhirnya, yang dikumpulkan dan ditampilkan dalam urutan kronologis terbalik dengan Tweet terbaru ditampilkan terlebih dahulu, dan setiap Tweet sebelumnya ditampilkan satu demi satu saat digulir ke bawah.

Algoritme saat ini sebagian besar masih terdiri dari daftar Tweet dengan kronologi terbalik yang sama, tetapi Twitter melakukan pemeringkatan ulang untuk mencoba menampilkan Tweet paling menarik terlebih dahulu dan terutama dari Tweet terbaru.

Di latar belakang, Tweet telah diberi skor peringkat oleh model relevansi yang memprediksi seberapa menarik setiap Tweet bagi Anda, dan nilai skor ini menentukan urutan peringkat.

Tweet dengan skor tertinggi ditampilkan pertama di daftar timeline Anda, dengan sisa Tweet terbaru ditampilkan lebih jauh ke bawah. Perlu dicatat bahwa diselingi di timeline Anda sekarang juga Tweet dari akun yang tidak Anda ikuti, serta beberapa Tweet iklan.

Grafik koneksi Twitter

Pertama-tama, salah satu aspek yang paling berpengaruh dari timeline Twitter adalah bagaimana Twitter sekarang menampilkan Tweet berdasarkan tidak hanya koneksi langsung Anda pada saat ini, tetapi pada dasarnya apa grafik sosial unik Anda, yang dirujuk oleh Twitter dalam paten sebagai " grafik koneksi”.

Grafik koneksi mewakili akun sebagai node dan hubungan sebagai garis ("tepi") yang menghubungkan satu atau lebih node. Sebuah hubungan dapat merujuk pada asosiasi antara akun Twitter.

Misalnya, mengikuti, berlangganan (seperti melalui program Super Follows Twitter atau, berpotensi, untuk fitur berlangganan yang diumumkan Twitter untuk kueri kata kunci), menyukai, menandai, dll. – semua ini menciptakan hubungan.

Hubungan dalam grafik koneksi seseorang mungkin searah (misalnya, saya mengikuti Anda) atau dua arah (misalnya, kami berdua saling mengikuti). Jika saya mengikuti Anda, tetapi Anda tidak mengikuti saya, saya akan memiliki harapan yang lebih besar untuk melihat Tweet dan Retweet Anda muncul di linimasa saya, tetapi Anda tidak perlu berharap untuk melihat milik saya.

Hanya berdasarkan grafik koneksi, Anda mungkin melihat Tweet dan Retweet dari orang-orang yang telah Anda ikuti, serta Tweet yang disukai atau dibalas oleh koneksi Anda.

Algoritme Twitter telah memperluas Tweet yang mungkin Anda lihat di luar akun yang pernah berinteraksi langsung dengan Anda. Tweet yang mungkin Anda lihat di linimasa Anda sekarang juga mencakup Tweet dari orang lain yang memposting tentang topik yang Anda ikuti, Tweet yang serupa dalam beberapa hal dengan Tweet yang sebelumnya Anda sukai, dan Tweet berdasarkan topik yang diprediksi oleh algoritme mungkin Anda sukai.

Bahkan di antara jenis Tweet yang diperluas yang mungkin Anda dapatkan, sistem peringkat algoritme berlaku – Anda tidak menerima semua Tweet yang cocok dengan topik, suka, dan minat yang diprediksi – Anda menerima daftar yang dikuratori melalui algoritme Twitter.

Peringkat menarik

Di dalam DNA sejumlah paten dan algoritme Twitter untuk memeringkat Tweet, terdapat konsep "ketertarikan".

Ini kemungkinan besar terinspirasi oleh paten yang diberikan kepada Yahoo Pada tahun 2006 yang disebut "Peringkat ketertarikan objek media", yang menggambarkan metode peringkat yang digunakan dalam algoritme untuk Flickr (layanan berbagi foto media sosial dominan yang kemudian dikalahkan oleh Instagram dan Pinterest).

Algoritma sebelumnya untuk Flickr memiliki banyak kesamaan dengan paten kontemporer Twitter. Ini menggunakan faktor yang serupa dan bahkan identik untuk menghitung daya tarik. Ini termasuk:

  • Informasi lokasi.
  • Data meta konten.
  • Kronologi.
  • Pola akses pengguna.
  • Sinyal minat (seperti menandai, berkomentar, memfavoritkan).

Seseorang dapat dengan mudah menggambarkan algoritme Twitter sebagai mengambil algoritme daya tarik Flickr, memperluas beberapa faktor yang terlibat, menghitungnya melalui proses pembelajaran mesin yang lebih canggih, menafsirkan konten berdasarkan pemrosesan bahasa alami (NLP), dan menggabungkan sejumlah variasi tambahan ke memungkinkan kecepatan untuk presentasi hampir secara real-time untuk sejumlah besar pengguna secara bersamaan.

Peringkat Twitter dan spam

Menarik juga untuk memfokuskan beberapa metode yang digunakan oleh Twitter untuk mendeteksi spam, akun pengguna spam, dan untuk menurunkan atau menekan Tweet spam agar tidak terlihat.

Pemolisian untuk disinformasi, konten pelanggaran kebijakan lainnya, dan pelecehan juga intens, tetapi itu tidak selalu menyatu dengan evaluasi peringkat.

Beberapa paten pendeteksian spam menarik karena saya melihat pengguna sering kandas dalam proses penindasan spam Twitter secara tidak sengaja, dan ada beberapa hal yang dapat dilakukan yang mengakibatkan upaya sandbagging untuk mempromosikan dan berinteraksi dengan audiens Twitter. Twitter harus membangun proses pengawas yang agresif untuk mengawasi dan menghapus spam, dan bahkan pengguna yang paling menonjol pun dapat melanggar proses ini dari waktu ke waktu.

Dengan demikian, pemahaman tentang faktor spam Twitter dapat menjadi penting karena dapat menyebabkan Tweet seseorang mendapatkan pengurangan dari ketertarikan yang seharusnya mereka miliki, dan hilangnya skor relevansi ini dapat mengurangi visibilitas dan kekuatan distribusi Tweet Anda.

Faktor peringkat Twitter

Jadi, faktor apa saja yang disebutkan dalam paten Twitter untuk menilai “minat”, dan apa yang memengaruhi cara Twitter menilai Tweet untuk peringkat?

Kekinian postingan Tweet

Dengan yang lebih baru umumnya jauh lebih disukai. Selain kata kunci tertentu dan jenis pencarian lainnya, sebagian besar Tweet berasal dari beberapa jam terakhir. Beberapa Tweet "jika Anda melewatkannya" juga dapat disertakan, yang tampaknya berkisar terutama selama satu atau dua hari terakhir.

Gambar atau Video

Secara umum, secara umum, Google dan platform lain telah mengindikasikan bahwa pengguna cenderung lebih memilih media gambar dan video, sehingga Tweet yang berisi keduanya mungkin mendapatkan skor yang lebih tinggi.

Twitter secara khusus mengutip kartu gambar dan video, yang mengacu pada situs web yang telah menerapkan Kartu Twitter, yang memungkinkan Twitter untuk dengan mudah menampilkan cuplikan pratinjau yang lebih kaya ketika Tweet berisi tautan ke halaman web dengan markup kartu.

Tweet dengan tautan yang menampilkan gambar dan video umumnya lebih menarik bagi pengguna, tetapi mungkin ada keuntungan tambahan untuk Tweet yang menautkan ke halaman dengan markup kartu untuk menampilkan konten kartu

Interaksi dengan Tweet

Twitter mengutip Suka dan Retweet, tetapi metrik tambahan yang terkait dengan Tweet juga berpotensi berlaku di sini. Interaksi meliputi:

  • Suka
  • Retweet
  • Klik ke tautan yang mungkin ada di Tweet
  • Klik ke tagar di Tweet
  • Klik ke akun Twitter yang disebutkan dalam Tweet
  • Detail Perluas – klik untuk melihat detail tentang Tweet, seperti untuk melihat siapa yang Menyukainya, atau Me-Retweet.
  • Follows Baru – berapa banyak orang yang mengarahkan kursor ke nama pengguna dan kemudian mengklik untuk mengikuti akun tersebut.
  • Kunjungan profil – berapa banyak orang yang mengklik avatar atau nama pengguna untuk mengunjungi profil pembuat poster.
  • Berbagi – berapa kali Tweet dibagikan melalui tombol bagikan.
  • Membalas Tweet

Tayangan

Sementara sebagian besar tayangan berasal dari tampilan Tweet di garis waktu, beberapa tayangan diperoleh saat Tweet dibagikan melalui penyematan di halaman web. Ada kemungkinan bahwa jumlah tayangan tersebut juga dapat mempengaruhi skor ketertarikan untuk Tweet.

Kemungkinan Interaksi

Satu paten Twitter menjelaskan penghitungan skor untuk Tweet yang mewakili seberapa besar kemungkinan pengikut Penulis Tweet di sistem pesan sosial akan berinteraksi dengan pesan, skor didasarkan pada deviasi tingkat interaksi yang dihitung antara tingkat interaksi yang diamati dari Pengikut Penulis dan tingkat interaksi yang diharapkan dari Pengikut.

Panjang Tweet

Salah satu jenis klasifikasi adalah panjang teks yang terdapat dalam Tweet, yang dapat diklasifikasikan sebagai nilai numerik (misalnya 103 karakter), atau dapat ditetapkan sebagai salah satu dari beberapa kategori (misalnya, pendek, sedang, atau panjang) .

Menurut topik yang terkait dengan Tweet, itu mungkin dinilai lebih atau kurang menarik – untuk beberapa topik, pendek mungkin lebih bermanfaat, dan untuk beberapa topik lain, panjang sedang atau panjang mungkin membuat Tweet lebih menarik.

Interaksi Penulis Sebelumnya

Interaksi sebelumnya dengan penulis Tweet akan meningkatkan kemungkinan (dan skor peringkat di linimasa seseorang) bahwa seseorang akan melihat Tweet lain dari penulis yang sama.

Metrik interaksi grafik sosial ini dapat mencakup penilaian berdasarkan asal hubungan.

Jadi, riwayat membalas, menyukai, atau me-Retweet Tweet penulis sebelumnya, bahkan jika seseorang tidak mengikuti akun tersebut, dapat meningkatkan kemungkinan seseorang akan melihat Tweet terbaru mereka.

Ada kemungkinan bahwa interaksi terbaru seseorang dengan penulis Tweet juga menjadi faktor dalam hal ini, jadi jika Anda sudah lama tidak berinteraksi dengan salah satu Tweet mereka, potensi visibilitas Tweet baru mereka mungkin berkurang untuk Anda.

Dalam konteks algoritme, "penulis" dan "akun" pada dasarnya digunakan untuk mengartikan hal yang sama, sehingga Tweet dari akun perusahaan diperlakukan sama dengan Tweet dari individu.

Peringkat Kredibilitas Penulis

Skor ini dapat dihitung dengan hubungan dan interaksi penulis dengan pengguna lain.

Contoh yang diberikan dalam paten adalah bahwa seorang penulis yang diikuti oleh beberapa akun profil tinggi atau produktif akan memiliki skor kredibilitas yang tinggi.

Sementara satu nilai peringkat yang dikutip adalah "rendah", "sedang", dan "tinggi", paten juga menyarankan skala nilai peringkat dari 1 hingga 10, dan itu dapat mencakup faktor kualitatif dan/atau kuantitatif.

Saya kira kisaran seperti 1 hingga 10 jauh lebih mungkin. Tampaknya beberapa nilai penilaian spam dapat digunakan untuk mengurangi Peringkat Kredibilitas Penulis. Lebih lanjut tentang faktor penilaian spam potensial di bagian akhir artikel ini.

Relevansi Penulis

Ada kemungkinan bahwa penulis yang dinilai lebih relevan untuk topik tertentu mungkin memiliki nilai Relevansi Penulis yang lebih tinggi. Selain itu, penyebutan seorang Penulis dapat membuatnya lebih relevan dalam konteks Tweet yang menyebutkannya.

Paten juga berbicara tentang mengaitkan Penulis dengan topik, sehingga ada kemungkinan bahwa Penulis yang Tweetnya melibatkan topik tertentu secara sering, bersama dengan tingkat keterlibatan yang baik, dapat dianggap memiliki relevansi yang lebih tinggi ketika Tweet mereka melibatkan topik tersebut.

Metrik Penulis

Tweet dapat diklasifikasikan berdasarkan properti Penulis. Metrik ini dapat memengaruhi daya tarik relatif dari pesan Penulis. Metrik Penulis tersebut meliputi:

  • Lokasi Penulis (seperti Kota atau Negara)
  • Usia (berdasarkan tanggal lahir yang dapat diberikan dalam detail akun)
  • Jumlah Pengikut
  • Jumlah Akun yang Diikuti Penulis
  • Rasio Jumlah Pengikut ke Akun yang Diikuti , karena jumlah Pengikut yang lebih besar dibandingkan dengan Yang Diikuti menunjukkan popularitas yang lebih besar seiring dengan jumlah Pengikut mentah. Rasio yang mendekati 1 akan menunjukkan quid pro quo mengikuti filosofi di pihak Penulis, sehingga kurang mungkin untuk menyimpulkan popularitas dan meminjamkan penampilan popularitas buatan.
  • Jumlah Tweet yang Diposting oleh Penulis per Periode Waktu (misalnya: per hari, atau per minggu).
  • Umur Akun (bulan sejak akun dibuka, misalnya) – dengan akun yang telah dibuat baru-baru ini diberi bobot yang jauh lebih rendah.
  • Memercayai.

Topik

Tweet diklasifikasikan menurut topik yang mereka libatkan. Ada beberapa algoritma yang sangat canggih yang terlibat dalam mengklasifikasikan Tweet.

Pengguna Twitter sering kali memilih topik untuk dikaitkan dengan akun mereka, dan Anda jelas akan diperlihatkan Tweet populer dari topik yang Anda pilih. Namun, Twitter juga secara otomatis membuat topik berdasarkan kata kunci yang ditemukan di Tweet.

Berdasarkan interaksi Anda dengan Tweet dan akun yang Anda ikuti, Twitter juga memprediksi topik yang mungkin Anda minati, dan menampilkan beberapa Tweet dari topik tersebut meskipun Anda tidak secara resmi berlangganan topik tersebut.

Klasifikasi Frasa

Sistem Twitter sangat kompleks, dan memungkinkan model peringkat khusus untuk berpotensi diterapkan pada Tweet untuk topik tertentu dan ketika frasa tertentu ada.

Twitter memiliki staf besar yang bekerja untuk mengembangkan model untuk "perjalanan pelanggan" tertentu, dan ini tampaknya bertepatan dengan deskripsi paten tentang bagaimana editor dapat menetapkan aturan pada posting dan kata kunci atau frasa berorientasi topik dalam posting.

Misalnya, postingan yang berisi teks tentang “rekrut sekarang” atau “akan tayang di TV” mungkin dianggap membosankan untuk suatu topik, sementara frasa seperti “segar”, “diobral”, atau “hanya hari ini” mungkin diberi bobot lebih besar karena bisa diprediksi lebih menarik.

Ini bisa sangat sulit untuk dipenuhi, karena ada banyak topik potensial dan bobot khusus yang dapat diterapkan.

Satu posting pekerjaan baru-baru ini di Twitter untuk Perancang Produk Staf, Perjalanan Pelanggan menjelaskan bagaimana posisi itu akan membantu:

“Apakah Anda mencari fanart Ariana Grande, #herpetology, atau unicycling ekstrim, semuanya terjadi di Twitter. Tim kami bertanggung jawab untuk membantu anggota baru menavigasi beragam percakapan publik yang terjadi di Twitter dan dengan cepat menemukan rasa memiliki…”

“Kumpulkan wawasan dari data dan penelitian kualitatif, kembangkan hipotesis, buat sketsa solusi dengan prototipe, dan uji ide dengan tim peneliti kami dan dalam eksperimen.”

“Dokumentasikan model interaksi terperinci dan spesifikasi UI.”

“Pengalaman mendesain untuk pembelajaran mesin, taksonomi kaya, dan/atau grafik minat.”

Deskripsi ini terdengar sangat mirip dengan apa yang dijelaskan dalam paten Twitter untuk "Sistem dan metode untuk menentukan relevansi konten sosial" di mana:

“Editor mungkin menetapkan aturan untuk mengklasifikasikan frasa tertentu sebagai kurang lebih menarik…”

“…seorang editor dapat memutuskan bahwa beberapa frasa dan atribut menarik di semua konten, terlepas dari kategori tempat penulis konten tersebut. Misalnya, frasa 'dijual' atau 'acara' mungkin menarik dalam semua kasus dan bobot positif dapat diterapkan.”

Satu paten menjelaskan bagaimana Tweet yang terdeteksi memiliki bahasa komersial dapat diberi skor lebih rendah daripada Tweet yang tidak memiliki bahasa komersial. (Sebaliknya, bobot tersebut dapat dibalik jika pengguna melakukan penelusuran yang menunjukkan minat untuk membeli sesuatu, sehingga Tweet yang berisi bahasa komersial dapat diberi bobot yang lebih tinggi.)

Waktu

Waktu dalam sehari dapat digunakan untuk memengaruhi relevansi. Misalnya, aturan dapat diterapkan untuk memberi bobot lebih pada Tweet yang menyebutkan “Kopi” antara pukul 8:00 hingga 10:00, dan/atau pada Tweet yang diposting oleh kedai kopi.

Lokasi

Paten menjelaskan bagaimana "referensi tempat" di Tweet dapat menimbulkan bobot yang lebih besar untuk Tweet tentang suatu tempat, dan/atau ke akun yang terkait dengan referensi tempat dibandingkan dengan akun lain yang hanya menyebutkan tempat tersebut. Juga kedekatan geografis antara lokasi perangkat pengguna dan lokasi yang terkait dengan item konten (teks Tweet, gambar, video, dan/atau Penulis) dapat menambah atau mengurangi potensi relevansi.

Bahasa

Bahasa Tweet dapat diklasifikasikan (misalnya, Inggris, Prancis, dll.).

Bahasa dapat ditentukan secara otomatis menggunakan berbagai alat penilaian bahasa otomatis.

Tweet dalam bahasa tertentu akan lebih menarik bagi penutur bahasa tersebut dan kurang menarik bagi orang lain.

Balas Tweet

Tweet dapat diklasifikasikan berdasarkan apakah tweet tersebut merupakan balasan dari Tweet sebelumnya. Tweet yang merupakan balasan dari Tweet sebelumnya mungkin dianggap kurang menarik dibandingkan Tweet tentang topik baru.

Dalam satu deskripsi paten, topik Tweet dapat menentukan apakah Tweet akan ditujukan untuk ditampilkan ke akun lain atau disertakan dalam aliran pesan akun lain.

Saat Anda melihat timeline Anda, ada beberapa contoh di mana beberapa balasan Tweet juga ditampilkan dengan Tweet utama – seperti ketika Tweet Balasan diposting oleh akun yang Anda ikuti. Dalam kebanyakan kasus, Tweet Balasan hanya akan dapat dilihat ketika satu klik untuk melihat utas, atau klik Tweet untuk melihat semua Balasan.

Akun “Berkah”

Ini adalah konsep yang aneh, yang saya yakini mungkin tidak akan diproduksi.

Twitter menggambarkan Akun yang Diberkati sebagai diidentifikasi dalam grafik percakapan tertentu, di mana Penulis asli dalam percakapan akan dianggap "diberkati", dan dari balasan berikutnya ke pos asli, salah satu Balasan yang kemudian dibalas oleh akun diberkati menjadi "diberkati" juga.

Tweet yang diposting oleh Akun Terberkati dalam percakapan akan diberikan peningkatan skor relevansi.

Profil Situs Web

Ini tidak disebutkan dalam paten Twitter, tetapi terlalu masuk akal dalam konteks semua faktor lain yang mereka sebutkan untuk dilewatkan.

Banyak situs web konten utama sering membagikan tautannya di Twitter, dan Twitter dapat dengan mudah membuat skor reputasi/popularitas profil situs web yang juga dapat menjadi faktor dalam peringkat Tweet ketika tautan ke konten di situs web diposting.

Situs berita, sumber informasi, situs hiburan – semua ini dapat memiliki skor yang dikembangkan dari faktor yang sama yang digunakan untuk menilai akun Twitter. Tweet dari situs web yang lebih disukai dan lebih terlibat dengan situs web dapat diberi bobot lebih besar daripada situs web yang relatif tidak dikenal dan kurang berinteraksi.

Twitter Terverifikasi

Ya, jika Anda menduga lencana biru di sebelah nama pengguna menyampaikan perlakuan istimewa, ada kata-kata khusus di salah satu paten Twitter yang mengonfirmasi bahwa mereka setidaknya telah mempertimbangkan hal ini.

Karena akun Terverifikasi sering kali sudah memiliki berbagai indikator popularitas lain yang terkait dengannya, tidak jelas apakah faktor ini sedang digunakan atau tidak. Tweet yang diposkan oleh akun yang Terverifikasi dapat diberi skor relevansi yang lebih tinggi, memungkinkannya muncul lebih banyak daripada Tweet akun yang belum diverifikasi.

Berikut adalah deskripsi paten:

“Dalam satu atau lebih perwujudan penemuan, modul percakapan (120) mencakup fungsionalitas untuk menerapkan filter relevansi guna meningkatkan skor relevansi dari satu atau lebih akun pembuat grafik percakapan yang diidentifikasi dalam daftar putih akun terverifikasi. Misalnya, daftar putih akun terverifikasi dapat berupa daftar akun yang merupakan akun profil tinggi yang rentan terhadap peniruan identitas. Dalam contoh ini, akun selebriti dan bisnis akan diverifikasi oleh platform pengiriman pesan (100) untuk memberi tahu pengguna platform pengiriman pesan (100) bahwa akun tersebut asli. Dalam satu atau lebih perwujudan dari penemuan ini, modul percakapan (120) dikonfigurasi untuk meningkatkan skor relevansi dari akun pembuat yang diverifikasi dengan jumlah/persentase yang telah ditentukan sebelumnya.”

Memiliki Tren

Ini adalah tanda biner yang menunjukkan apakah Tweet telah diidentifikasi mengandung topik yang sedang tren pada saat pesan itu disiarkan.

Aplikasi Terdeteksi Gender, Orientasi & Minat Seksual

Twitter mungkin dapat menggunakan informasi perangkat seluler pemegang akun untuk menyimpulkan Jenis Kelamin pemegang akun, atau menyimpulkan minat dalam topik seperti Berita, Olahraga, Latihan Beban, dan topik lainnya.

Beberapa perangkat seluler memberikan informasi tentang aplikasi lain yang dimuat di telepon untuk tujuan mendiagnosis potensi konflik pemrograman aplikasi. Dengan demikian, beberapa Tweet yang cocok dengan Jenis Kelamin, Orientasi Seksual, dan Minat Topik Anda dapat diberi poin lebih menarik hanya berdasarkan kesimpulan yang dibuat dari aplikasi ponsel Anda. (Lihat: https://screenrant.com/android-apps-collecting-app-data/ )

Dan lebih banyak faktor peringkat

Twitter menyatakan bahwa:

“Daftar fitur yang kami pertimbangkan dan interaksinya yang bervariasi terus bertambah, menginformasikan model kami tentang pola perilaku yang semakin bernuansa.”

Jadi, daftar faktor ini kemungkinan merupakan representasi yang kurang dari faktor-faktor yang mungkin mereka gunakan, dan daftar mereka mungkin bertambah.

Bayangkan juga bahwa kombinasi khusus dari beberapa faktor di atas dapat diterapkan sebagai model untuk Tweet yang terkait dengan topik tertentu, memberikan potensi kompleksitas yang besar pada peringkat melalui metode pembelajaran mesin. (Sekali lagi, pembelajaran mesin yang diterapkan untuk membuat model pembobotan peringkat khusus untuk kueri atau topik tertentu sangat mirip dengan metode yang mungkin digunakan dengan Google.)

Twitter telah menyatakan bahwa penilaian Tweet terjadi setiap kali seseorang mengunjungi Twitter, dan setiap kali seseorang memperbarui timeline mereka. Mempertimbangkan beberapa faktor kompleks yang terlibat, itu sangat cepat!

Twitter menggunakan pengujian A/B terhadap pembobotan faktor peringkat, dan perubahan algoritme lainnya, dan menentukan apakah perubahan yang diusulkan merupakan peningkatan berdasarkan keterlibatan dan waktu melihat/berinteraksi dengan Tweet. Ini digunakan untuk melatih model peringkat.

Keterlibatan pembelajaran mesin dalam proses ini menunjukkan bahwa model peringkat dapat diproduksi untuk banyak skenario tertentu, dan berpotensi spesifik untuk topik dan jenis pengguna tertentu. Setelah dikembangkan, model dapat diuji, dan jika meningkatkan keterlibatan, model dapat diluncurkan dengan cepat ke semua pengguna.

Bagaimana pemasar dapat menggunakan informasi ini

Ada banyak kesimpulan yang dapat ditarik dari daftar faktor peringkat potensial, dan yang dapat digunakan oleh pemasar untuk meningkatkan taktik Tweeting mereka.

Akun Twitter yang hanya memposting pengumuman tentang produknya dan informasi promosi tentang perusahaannya kemungkinan tidak akan memiliki visibilitas sebanyak akun yang lebih interaktif dengan komunitasnya, karena interaksi menghasilkan lebih banyak sinyal peringkat dan potensi manfaat.

Pakar media sosial telah lama merekomendasikan pendekatan untuk memadukan jenis posting daripada hanya menerbitkan promosi referensi diri – strategi ini termasuk “Aturan Sepertiga”, “Aturan 80/20”, dan lainnya.

Faktor peringkat Twitter kemungkinan mendukung teori ini, karena memunculkan lebih banyak interaksi dengan jumlah pengguna Twitter kemungkinan besar akan meningkatkan visibilitas akun.

Misalnya, akun perusahaan besar dengan banyak pengikut dapat memposting jajak pendapat yang menarik untuk mendapatkan saran tentang fitur apa yang harus ditambahkan ke produknya. Suara dan komentar yang diposting oleh pengguna akan membuat responden lebih mungkin melihat postingan perusahaan berikutnya karena interaksi terakhir, dan postingan berikutnya dapat mempromosikan atau mengumumkan sesuatu yang baru. Dan, pengikut responden mungkin juga lebih mungkin melihat postingan perusahaan berikutnya, karena Twitter tampaknya memperhitungkan bahwa pengguna dengan minat yang sama mungkin lebih terbuka untuk melihat konten yang sesuai dengan minat mereka.

Juga, faktor-faktor tersebut menyarankan sejumlah pendekatan yang berpotensi menguntungkan.

Saat memposting Tweet yang mempromosikan produk atau membuat pengumuman, menggabungkan sesuatu untuk mendapatkan tanggapan dari pengikut seseorang dapat dengan mudah memperluas keterpaparan di platform karena setiap balasan responden ke Tweet Anda dapat meningkatkan kemungkinan pengikut langsung mereka dapat melihat Tweet asli dan Tweet mereka. Tweet balasan koneksi.

Memanfaatkan aspek grafik sosial dari algoritme Twitter dapat membantu meningkatkan daya tarik Tweet Anda, dan dapat meningkatkan eksposur Tweet Anda untuk pengguna lain.

Faktor spam dapat berdampak negatif pada peringkat tweet

Algoritme deteksi spam dapat berdampak negatif pada kemampuan peringkat Tweet.

Untuk satu hal, Twitter sangat cepat untuk menangguhkan akun yang secara terang-terangan melakukan spam, dan dalam kasus di mana jelas dan tegas, seseorang dapat mengharapkan akun tersebut dihentikan secara tiba-tiba, menyebabkan semua Tweet-nya menghilang dari grafik percakapan dan garis waktu, dan menyebabkan profil akun tidak lagi tersedia untuk dilihat.

Dalam kasus lain di mana tidak jelas apakah suatu akun adalah spam, Tweet akun dapat diturunkan dengan menerapkan skor bobot peringkat negatif, atau Tweet dapat dikunci atau ditangguhkan sampai atau jika pemegang akun mengambil tindakan korektif atau memverifikasi identitas mereka.

Misalnya, akun Twitter dengan riwayat panjang Tweet yang bagus mungkin tiba-tiba mulai memposting iklan Viagra atau tautan ke malware, seperti jika akun yang sudah ada diretas. Twitter mungkin menangguhkan akun untuk sementara hingga tindakan korektif diambil, seperti lulus verifikasi CAPTCHA, atau menerima kode verifikasi melalui ponsel dan mengubah kata sandi. Contoh lain adalah pengguna baru yang secara tidak sengaja melewati beberapa ambang batas mengikuti terlalu banyak akun dalam jangka waktu yang singkat, atau memposting terlalu sering.

Twitter menggunakan sejumlah metode untuk mendeteksi spam dan mengesampingkannya sehingga pengguna tidak terlalu melihatnya.

Sebagian besar pendeteksian otomatis bergantung pada pendeteksian kombinasi karakteristik profil akun, perilaku Tweeting akun, dan konten yang ditemukan di Tweet akun.

Twitter telah mengembangkan sejumlah "sidik jari" spam yang khas untuk melakukan deteksi pola yang cepat. Satu paten Twitter menjelaskan bagaimana:

“Spam ditentukan dengan membandingkan karakteristik akun spam yang teridentifikasi, dan membuat 'grafik kesamaan' yang dapat dibandingkan dengan akun lain yang diduga spam."

Tweet yang diidentifikasi berpotensi mengandung spam dapat ditandai dengan nilai biner seperti "ya" atau "tidak", dan kemudian Tweet yang ditandai dapat disaring keluar dari garis waktu.

Ada kemungkinan yang sama untuk skala spam, dihitung dari beberapa faktor, dan setelah Tweet atau akun melampaui ambang batas, maka ia akan mengalami penurunan pangkat. Saya pikir ada baiknya untuk menyertakan penyebutan ini karena pengguna Twitter mungkin tidak memahami implikasi dari cara penggunaan platform. Misalnya, mengeposkan satu Tweet yang terlalu agresif dapat berdampak negatif pada Tweet berikutnya dari akun untuk jangka waktu tertentu. Perilaku tegang yang berulang dapat berakibat lebih buruk, seperti penghapusan akun sepenuhnya, tanpa peluang untuk pulih.

Saya akan menambahkan beberapa faktor di sini yang tidak secara khusus disebutkan dalam paten Twitter atau posting blog karena Twitter tidak mengungkapkan semua faktor identifikasi spam untuk alasan yang jelas. Namun, beberapa karakteristik akun spam dan spam tampak begitu jelas sehingga saya menambahkan beberapa dari pengamatan pribadi atau dari sumber penelitian terkemuka untuk memberikan pemahaman yang lebih luas tentang apa yang dapat menyebabkan penurunan pangkat karena spam.

Faktor spam & faktor peringkat negatif lainnya

  • Tweet yang berisi pesan komersial yang diposting tanpa hubungan pengikut/pengikut atau dalam hubungan searah (Penulis Tweet mengikuti akun yang disebutkan tetapi akun penerima tidak mengikuti Penulis), tetapi tidak memiliki interaksi sebelumnya, mulai terlihat mencurigakan. Jika hal ini dilakukan berkali-kali dengan teks yang mirip atau identik, tidak akan lama untuk dianggap sebagai aktivitas spam, terutama untuk akun yang lebih baru.
  • Usia Akun – di mana usia menunjukkan akun telah disiapkan baru-baru ini. (Penelitian terbaru SparkToro tentang spam Twitter menunjukkan usia akun 90 hari atau kurang.)
  • Bendera NSFW Akun – akun memiliki bendera yang menunjukkan bahwa akun tersebut telah diidentifikasi untuk menautkan ke situs web yang didokumentasikan dalam daftar hitam situs yang berpotensi menyinggung (seperti situs yang mengandung pornografi, materi eksplisit, gore, dll).
  • Bendera Ofensif – Tweet telah diidentifikasi mengandung satu atau lebih istilah dari daftar hitam istilah ofensif.
  • Potentially Fake Account – the account is suspected of impersonating a real person or organization, and has not been verified.
  • Account Posting Frequent Copyright Infringement
  • Blacklisting – One patent suggests use of a blacklist that will apply a relevance filter to decrease the relevance scores of accounts that can include but are not limited to: spammers, potentially fake accounts, accounts with a potential or history of posting adult content, accounts with a potential or history of posting illegal content, accounts flagged by other users, and/or meeting any other criteria for flagging accounts.
  • Account Bot Flag – identifying that the account broadcasting the Tweet has been IDed as potentially being operated by a software application instead of by a human. This particular criteria has a number of implications involved, particularly for those accounts that have used types of scheduling applications for posting Tweets, or other software that generates automated Tweets. For instance, scheduling too many Tweets to be posted per time period through an app like Hootsuite or Sprout Social can result in the user account getting suspended, or its app access via the Twitter API to get suspended. This can be particularly galling, as if the same number of Tweets per time period were posted manually, the account would not run into issues. There has long been a believe among marketers on Facebook as well as Twitter that the respective algorithms might dumb-down visibility for posts published through software versus via manually, and this component suggests that that very well could be the case with Twitter.
  • Tweets containing offensive language might be allowed to erode their interestingness score.
  • Tweets posted via Twitter's APIs, such as through social media management tools that rely upon Twitter's API, are generally subject to greater scrutiny as Twitter has described “The problem may be exacerbated when a content sharing service opens its application programming interface (API) to developers.” My observation is that accounts that rely solely upon third-party posting applications and APIs – particularly newer accounts – may see their distribution ability somewhat sandbagged. Newer accounts should work to become established through human usage for an initial period before relying more upon scheduling and posting applications, and even established accounts may see greater distribution potential if they mix some human manual posting in combination with their scheduled/automated/third-party-application posts.
  • Accounts Dormant for a Long Period – Accounts that have not posted for a long time, and then suddenly spring to life do not immediately have the ranking ability they otherwise might. The reason for this is that spammers sometimes may successfully hijack inactive accounts in order to subvert a previously bona fide account into posting spam.
  • Device Profile Associated With Spammer or Other Policy Violator – Essentially, patents suggest that Twitter is using Browser Fingerprinting and Device Fingerprinting to detect spammers and other bad players. Fingerprinting enables tech services to generate profiles of a combo of data that would include things like IP address, device ID, user agent, browser plugins, device platform model and version, and app downloads to create unique “fingerprints” to identify specific devices. A major takeaway from this is that if you have two or more Twitter accounts you use with your phone or browser, if you perform abusive Tweeting through one of those accounts, there is the very real possibility that it could impair rankings in a more “professional” account you operate on the same device. In a worst-case scenario, it could even get you locked-out of both accounts for what you may do on one. This has pretty serious implications for companies and agencies that have employees conducting professional Tweets, while they may switch on their device to posting personal Tweets as well. Some types of Tweets that could cause issues would include: Spam, Harassment, False or Misleading Info, Threats, repeated Copyright Infringement, posting Malware links, and likely more. While I theorize that a personal account could also get a professional account suspended on the same device, I would hazard a guess that it might only suspend the professional account for that particular device holder, and the professional account could be subsequently accessed through a different device.
  • Lack of other app usage data – It is very possible that Twitter may be able to receive data from mobile devices that indicates if the device operator has downloaded or recently used other apps on the device beyond just the Twitter app. (See: https://screenrant.com/android-apps-collecting-app-data/ ) A common spam account characteristic is that they do not reflect other app usage because the device is primarily dedicated to spamming Twitter and is not showing human usage characteristics. Or, the account is hosted on a webserver instead of a mobile device, and is attempting to imitate the usage profile of a human user.
  • Blocks – accounts that other users have blocked numerous times, or accounts that have been blocked over a particular time frame can be indicative of a spam account.
  • Frequency of Tweets – if a number of Tweets sent from the same account in a given time frame exceeds a threshold amount, then that account may be flagged as spam and denied from sending subsequent Tweets. This is not a hard-and-fast rule, or it is variable in application, because there are larger, corporate accounts with many staff members handling posting of Tweets to a large customer base, such as in the case of American Airlines. There are accounts such as this which are added to whitelists to avoid automatic suspension due to the large volumes of Tweets they may post within short time frames.
  • High Volume of Tweets with the Same Hashtag or Mentions of the Same @Username – Obviously, high-volume Tweets are risky, and increasing your volume within short timeframes will inch your account closer and closer to being deemed to be that of a spammer. Thus, attempting to overwhelm the timeline of a particular Hashtag will be deemed to be annoying and potentially spammy. Likewise, insisting upon gaining the attention of a particular account by mentioning them repeatedly will begin to appear annoying, unnecessary, abusive harassment, and/or spammy.
  • CAPTCHA – If suspected of spam, the service may prevent a Tweet from being written-to or published, requiring the user account to first pass a CAPTCHA challenge to establish that the account is operated by a human. (My agency has encountered this as we have set up new accounts on behalf of clients. This is more likely to happen when the computer that is used to set up the account has been used recently to set up other accounts, and the account is set up using free email service accounts instead of through mobile phones. Twitter also often requires sending a mobile text message to confirm a phone number before unblocking the account.)
  • Account Signup Reflects Anomoly – New accounts are exposed to greater scrutiny and suspicion within Twitter's systems, and one way of critiquing new accounts is based upon data associated with the initial account signup, since spammers have used automation to try to create large volumes of new accounts for bot usage. Twitter usage can reflect real account setups, or false ones, so Twitter has analyzed many false accounts and has developed fingerprint types of patterns to detect likely spam/bot accounts. For instance, when a human user accesses Twitter's account signup page in a browser window, to submit registration info, the browser will rapidly make calls back to Twitter's servers for dozens of elements that are used in composing the page in the browser – such as for Javascripts, cascading stylesheets, and images. Bots are more likely to submit registration info without first calling all the registration page elements. So, image requests and other filetype requests preceding a registration submission can be used to determine whether a new signup reflects an anomaly indicating a bot-generated signup has occurred. Thus, accounts signed-up with anomalous characteristics may have their Tweets deducted some in relevancy.
  • Bulk-Follow of Verified Accounts – Spam accounts will often bulk-follow prominent and/or Verified accounts in order to establish a foothold in the social graph. When setting up a Twitter account for a real, human user before, we used to follow a handful of the Verified accounts suggested by Twitter during the signup process. Oddly enough, this behavior alone can cause an account to get suspended until a CAPTCHA or other verification is passed. So, the takeaway here is do not follow all that many accounts suggested to you in the signup process if you are setting up a new account. Definitely do not use one of those automated follow services that people used to use a lot years ago, or your account could get downgraded in relevancy or suspended.
  • Few Followers – Spam accounts are often newer, and because they often do not promote themselves in ways beneficial to the community they inspire very few followers. So, a low follower account can be one factor in combination with others to identify a potentially spammy user.
  • Irrelevant Hashtags in Reply Tweets – Hashtags in Tweets that do not involve the original Tweet's topic.
  • Tweets Containing Affiliate Links – self explanatory.
  • Frequent Requests to Befriend Users in a Short Time Frame
  • Reposting Duplicate Content Across Multiple Accounts – Especially duplicate content posted close in time.
  • Accounts that Tweet Only URLs
  • Posting Irrelevant or Misleading Content to Trending Topics/Hashtags
  • Erroneous or Fictitious Profile Location – For example, a profile location showing “Poughkeepsie, NY”, but the user's IP is China, would produce an apparent mismatch indicating a potential scammer or spammer account.
  • Account IP Address Matching Abuser Account Ranges, or Country Locations that Originate Greater Amounts of Abuse – For example, Russia. Likewise, commonly known proxied IP addresses are easily detectable by Twitter, and are flagged as suspect.
  • Default Profile Image – Human users are more likely to set up customized account images (“avatars”), so not setting one up and continued use of Twitter's default profile image is a red flag.
  • Duplicated Profile Image – A profile image duplicated across many accounts is a red flag.
  • Default Cover Image – Failure to set up a custom cover image in the profile's masthead is not as suspicious as continued use of a default profile image, but use of a different masthead image is more representative of a real account.
  • Nonresolving URL in Profile – SparkToro suggests this, and it does align with many spam accounts. Sometimes this is because spammers may be more likely to set up websites that are likely to be suspended, or typosquatting domains intended to create Trojan horse websites which can also get suspended.
  • Profile Descriptions Matching Spammer Keywords/Patterns
  • Display Usernames Conform To Spam Patterns – Usernames that are meaningless alphanumeric sequences, or proper names followed by multiple numeric digits reflect a lack of imagination upon the part of spammers who may be attempting to register hundreds of accounts in bulk, with each name generated randomly, or each username generated by adding the next number in a sequence. Example: John32168762 is the sort of username that most humans find undesirable.
  • Patterns – Profile and Tweet patterns used by spammers often reveal spammer accounts. For instance, if numbers of accounts with default Twitter profile pics and similar patterned display usernames all Tweet out links to a particular page or domain, those accounts all become extremely easy to identify and sideline.

Simply listing out spam identification factors sharply understates Twitter's sophisticated systems used for spam identification and spam management.

Major Silicon Valley tech companies have often fought spam for years now, and it has been described as a sort of arms race.

The tech company will create a method to detect the spam, and the spammers then evolve their processes to elude detection, and then the cycle repeats again, and again.

Kesimpulannya

Twitter's patents illustrate a huge sophistication in terms of employing components of Artificial Intelligence, social graph analysis, and methods that combine synchronous and asynchronous processing in order to deliver content extremely rapidly.

The AI components include:

  • Neural networks.
  • Natural language processing.
  • Circumflex calculation.
  • Markov modeling.
  • Logistic regression.
  • Decision tree analysis.
  • Random forest analysis.
  • Supervised and unsupervised machine learning.

As the ranking determinations can be based upon unique, abstracted, machine learning models according to specific phrases, topics, and interest profiling, what works for one area of interest may work a little differently for other areas of interest.

Even so, I think that looking at these many potential ranking factors that have been described in Twitter patents can be useful for marketers who want to attain greater exposure on Twitter's platform.

Author's disclosure

I served this year as an expert witness in arbitration between a company that sued Twitter for unfair trade practices, and the case was amicably settled recently.

As an expert witness, I am often privy to secret information, including private communications such as employee emails within major corporations, as well as other key documents that can include data, reports, presentations, employee depositions and other information.

In such cases, I am bound by legal protective orders and agreements not to disclose information that was revealed to me in order to be sufficiently informed on the matters I am asked to opine upon, and this was no exception.

I have not disclosed any information covered by the protective order in this article from my recently-resolved case.

I have gained a greater understanding and insights into some aspects of how Twitter functions from context, observations of Twitter in public use, logical projections based on their various algorithm descriptions and from reading Twitter's patents and other public disclosures subsequent to the resolution of the case I served upon, including the following sources:

  • Mengidentifikasi pesan yang relevan dalam grafik percakapan
  • Menyediakan konten untuk disiarkan oleh platform perpesanan
  • Mempromosikan konten dalam platform perpesanan waktu nyata
  • Sistem dan metode untuk menentukan relevansi konten sosial
  • Sistem dan metode untuk membangun atau memelihara jaringan sosial tepercaya yang dipersonalisasi
  • Menampilkan pesan yang relevan dari grafik percakapan
  • Cari infrastruktur
  • Pemfilteran visibilitas
  • Memprioritaskan Pesan Dalam Jaringan Pesan
  • Pembuat grafik aplikasi
  • Menggunakan Pembelajaran Mendalam pada Skala di Linimasa Twitter
  • Sistem dan metode anti-spam bertingkat
  • Mendeteksi interaksi skrip atau anomali dengan platform media sosial
  • Bagaimana Twitter memerangi spam dan otomatisasi berbahaya
  • Akun yang Ditangguhkan dalam Tinjauan Kembali: Analisis Spam Twitter
  • Analisis Twitter: 19,42% Akun Aktif Palsu atau Spam

Pendapat yang diungkapkan dalam artikel ini adalah dari penulis tamu dan belum tentu Search Engine Land. Penulis staf tercantum di sini.