今日頭條用算法打擊標題黨,今日頭條是一款新聞軟件,下載使用今日頭條的用戶可以根據(jù)自己的實際需要查看全國以及本地的新聞信息,了解發(fā)生的大小事,掌握信息的一手資料。那么今日頭條是怎么用算法來打擊標題黨的呢?就讓西西小編為您解答吧!
想要下載今日頭條APP各不同版本軟件以及了解更多資訊和使用教程,請點擊http://www.innovatechautomation.com/app/jinritoutiao/
今日頭條用算法打擊標題黨,控制質(zhì)量:
今日頭條并不是傳統(tǒng)意義上的媒體,而是一家有媒體屬性的科技公司,一個內(nèi)容創(chuàng)作與分發(fā)的平臺,其愿景是“成為最懂你的信息平臺,連接人與信息,促進創(chuàng)作與交流”。
調(diào)配分發(fā)資源,打擊標題亂象
今日頭條雖然提供資訊信息,但是其內(nèi)部并沒有編輯與記者,平臺上90%的內(nèi)容來源于頭條號,截至2017年3月底,已有超過60萬個人或組織開設(shè)頭條號。這就決定了今日頭條在打擊“標題黨”方面,要做的更多的是從生產(chǎn)層面和分發(fā)層面來進行控制。
具體來說,今日頭條所做的事情就是在分發(fā)的過程中,減少給“標題黨”的分發(fā)資源,而提升那些優(yōu)秀內(nèi)容得到分發(fā)資源的機率。這是提高效率的一種做法,也促使今日頭條能更好地打擊“標題黨”,貫徹主流價值觀,服務(wù)好用戶。
基于文本挖掘的機器“把關(guān)人”
很多“標題黨”常用的內(nèi)容元素其實都是可以在文本層面進行總結(jié)的,交由機器處理的效率會更高!罢齽t表達式”就是定義一系列與“標題黨”相關(guān)的詞匯來維護一些規(guī)則,進而使用這些規(guī)則來檢測每一篇文章。今日頭條實際有數(shù)百人的審核隊伍,建立起了一套比較完善的規(guī)則,并利用機器算法對每天幾十萬篇的新進文章進行篩選。由此,得到這些文章評級的高低,并對文章的標題和內(nèi)容進行判斷。
今日頭條建立了檢測“標題黨”的規(guī)則模型,警示頭條號作者的“標題黨”行為。當頭條號作者預發(fā)布文章的時候,如果標題中出現(xiàn)了“驚呆”“震驚”等內(nèi)容,會收到一個飄黃的窗口,提示其內(nèi)容涉及標題夸張,建議修改,如果作者繼續(xù)強行發(fā)布的話將會被限制推薦量。
Facebook在面對“標題黨”和假新聞時,依賴于用戶舉報。今日頭條建立“標題黨”的模型數(shù)據(jù)與國際上通行的做法類似,讓用戶對文章進行評論以及點擊“不喜歡”按鈕來表達個體意見,通過一些按鈕來收集用戶行為,再對文章的標題和內(nèi)容質(zhì)量進行判斷,從而把內(nèi)容質(zhì)量不高或是存在“標題黨”行為的推送限制在很小的范圍內(nèi)。
另外,機器也會自動形成對“標題黨”文本的識別,給不同的特征以不同權(quán)重的得分。在運行的過程中,今日頭條會將標題里面單個的詞進行拆分,并形成權(quán)重分數(shù),同時也對詞組進行拆分,由機器自動打分,分數(shù)一旦超過閾值就被認為是“標題黨”,頭條號作者會收到警示。
面對頭條號作者忽略警示強行發(fā)布的行為,頭條號建立了一套非常嚴苛的處罰規(guī)則。如果是非法來源,違反相關(guān)法規(guī)扣50分。另外,被舉報抄襲、“標題黨”、含有廣告信息、標題與正文不符,甚至文章標題中含有錯別字的文章,都被認為對用戶造成了不利影響,作者將會受到相應的扣分處罰。
千萬不能小看這些扣分,在頭條號中,扣10分意味著發(fā)文和微信的RSS接入禁止一天;如果被扣至0分,整個賬號就無法恢復。由于頭條號的賬號與每個人的身份證綁定,個人賬號的凍結(jié)意味著該作者失去了在今日頭條平臺上的話語權(quán)。如果被扣除50分,還將被取締廣告和自營廣告的權(quán)限,頭條號的商業(yè)價值將受到限制。同時,在頭條號平臺上打擊力度非常之重,公告欄上會定期發(fā)布整治各類標題的公告,在偽科學、股評、兩性、減肥這些“標題黨”泛濫的重災區(qū),進行專項治理。
數(shù)據(jù)方面,今日頭條平均每天有超過12000篇文章被提示修改,日均僅有1027篇文章還繼續(xù)強行提交,且強行提交之后會被進行很大程度的降權(quán)推薦,其中,476篇0閱讀,762篇閱讀量小于等于100。從2016年的7月至今,客戶端每周反饋量為每百萬DAU(日活躍用戶數(shù)量)從0.9降至0.3,即平均每100萬活躍用戶里,反映內(nèi)容存在“標題黨”的情況的人從原來的0.9人降到了0.3人。
以數(shù)據(jù)反哺內(nèi)容創(chuàng)作者
頭條號的標題非常難取,一方面需要突出新聞點,而另一方面,要考慮機器分發(fā)。機器和人工分發(fā)最大的不同在于:傳統(tǒng)媒體的編輯具有文本經(jīng)驗,機器則不然。人與機器溝通過程中需要做很多工作,如利用什么關(guān)鍵詞來描述某事件能讓文章更好地被機器識別,從而到達更精準的興趣人群,發(fā)揮內(nèi)容的最大價值,這是除了取好標題之外更迫切的需求,所以,標題留給創(chuàng)作者的空間很小,難度很大。
為了更好地實現(xiàn)用戶價值,提升用戶體驗,今日頭條推出了新的服務(wù)于創(chuàng)作者的產(chǎn)品——媒體實驗室。它將數(shù)據(jù)結(jié)果直接呈現(xiàn)給內(nèi)容創(chuàng)作者,提供適合在平臺上表達、分發(fā),并能夠取得優(yōu)良傳播效果的詞匯,將這些詞匯制成了可視化的分析圖表,給作者提供一些寫作角度的參考。
目前,媒體實驗室已經(jīng)服務(wù)于400多家媒體機構(gòu),包括7000多位內(nèi)容創(chuàng)作者用戶。比如,在美國大選期間對熱度進行監(jiān)控,通過定制關(guān)鍵詞,能夠?qū)n}進行相關(guān)的用戶畫像分析。
除此之外,內(nèi)容創(chuàng)作者還能對熱詞進行關(guān)聯(lián)分析,通過分析用戶的互動行為來挖掘創(chuàng)作的角度。作為一個創(chuàng)作者的服務(wù)平臺,媒體實驗室還會把今日頭條發(fā)布的數(shù)據(jù)報告第一時間進行發(fā)布,并為創(chuàng)作者提供原版下載。
目前,媒體實驗室已與一些媒體建立起了內(nèi)容合作關(guān)系。今日頭條將媒體內(nèi)容通過算法模型分發(fā)給不同興趣愛好的用戶,與此同時,媒體實驗室將用戶閱讀互動產(chǎn)生的數(shù)據(jù)收集并反饋給媒體,形成一種反哺的關(guān)系,就像打車軟件之于交通部門,外賣軟件之于食藥部門,媒體實驗室也可以把內(nèi)容分發(fā)的好壞、優(yōu)劣、內(nèi)容關(guān)鍵詞的關(guān)系等,反哺給媒體機構(gòu)甚至優(yōu)秀的自媒體作者,讓他們最高效地進行創(chuàng)作,在不同創(chuàng)作環(huán)境和垂直領(lǐng)域內(nèi)發(fā)揮自己創(chuàng)造力的最大價值。