TikTok 的真正優勢1,tiktok的優缺點和發展




TikTok 的真正優勢

亞馬遜的第一位產品經理對TikTok的剖析。

神譯局是36氪旗下編譯團隊,關注科技、商業、職場、生活等領域,重點介紹國外的新技術、新觀點、新風向。

編者按:字節跳動往往被說成是一家算法公司,很多人認爲,TikTok是靠算法的黑科技才取得成功的。事實真的是這樣嗎eugenewei認爲不是:TikTok的算法跟其他公司使用的並沒有太大的不同。TikTok最大的優勢是它採取了對算法友好的設計模式,在自己內部建立了一個飛輪,幫助其機器學習算法看到了優化自己所需要看到的東西。原文發表在其個人博客上,標題是:Seeing Like an Algorithm。篇幅關係,我們分兩部分刊出,此爲上半部分。

劃重點:

TikTok的算法本身沒什麼不一樣

TikTok的不一樣在於它的app設計讓算法“看到”有效精確地執行匹配工作所需的所有細節

現代社交網絡巨頭的傲慢導致自己陷入到錯綜複雜的問題不能自拔

爲了讓自己的算法發揮最大的效用,TikTok成爲了自己的訓練數據源

以用戶爲中心的設計模式一直佔據主導,但算法友好型設計正在逆襲

爲了最大限度地服務好用戶,請先服務好你的算法

TikTok的設計使得它的視頻、用戶和用戶首選項對For You Page算法清晰可見

在我上一篇關於TikTok的文章中,我討論了爲什麼它的For You Page算法是讓TikTok發揮作用的結締組織。它就是主板的總線,用來連接和關閉所有的反饋迴路。

但是,在急於瞭解爲什麼各家公司都想收購TikTok的情況下,如果字節跳動把這款熱門的短視頻app拆分出來的話,圍繞着它的算法的炒作已經有點被異化成那種往往被歸納爲最近西方對中國科技分析的套路了。

在這篇文章中,我想討論一下TikTok的設計究竟是如何幫助它的算法表現得跟它一樣好的。上次我討論了爲什麼FYP(For You Page)算法是TikTok飛輪的核心,但是如果這一算法不夠有效的話,那整個反饋迴路就會崩潰。哪怕你對TikTok或短視頻領域不感興趣,瞭解一下這個算法是如何實現精確性也很重要,因爲各行各業的公司都日益面臨着核心優勢是機器學習算法的競爭對手的競爭。

我想討論的是TikTok的設計是如何幫助它的算法“看”東西的。

《國家的視角》Vs算法的視角

James C.Scott的《國家的視角》(Seeing Like a State)是那種很獨特的書,看過之後你會意識到硅谷就有那種使用(濫用)清晰性這個術語的類型。我是在看到Venkatesh Rao的書摘之後第一次聽說這本書的,如果你不打算看原著的話,那篇書摘仍然是很好的tldr入門讀物(Scott Alexander的書評也不錯,只不過他的書評也已經長到可以做自己的tldr)。不過,我建議你還是要好好看看原著。

Scott那本書的副標題是“那些試圖改善人類狀況的項目是如何失敗的”。

這本書可以提高你對日常生活當中的各種意外後果的意識。當我們也有着偉人一般的傲慢時,不妨保持更謙卑的態度。這個世界比我們想象的要更豐富、更復雜。

比方說,Scott的討論有很多都跟我們的現代社交網絡巨頭的某種傲慢感有關。這些占主導地位的應用的目的就是要提高自身用戶羣的清晰性,其中包括促進互動、防止用戶流失並最終提供定向廣告。反過來,這又導致他們的母公司陷入到錯綜複雜的問題之中,至今都未能擺脫困境。

不過這是需要另行討論的話題了。Scott關注的是民族國家如何用簡化的抽象在概要的層面“看清”自己的公民,而我想討論的是TikTok的app設計是如何讓它的算法“看到”有效精確地執行匹配工作所需的所有細節的。這篇文章討論的則是是應用和服務在設計時最大限度利用機器學習新模式。(我知道,這種討論有點諷刺意味,因爲這種“看法”有可能被塑造爲另一種決定用戶看法的看法,一種美國的科技公司只能作壁上觀的看法。)

TikTok把自己變成算法的訓練源

近年來,至少在像我這樣的門外漢看來,我們意識到,只需要通過把訓練的數據量增加幾個數量級,機器學習就可以取得很大程度的進步。也就是說,就算算法本身跟幾年前沒有太大的不同,僅通過在更大的數據集上對其進行訓練,人工智能研究人員就能取得像GPT3這樣的突破(GPT3暫時給科技Twitter們帶來了高潮))。

當大家說TikTok的算法是取得成功的關鍵時,很多人會把某些神奇的代碼段看作是公該司的祕密武器。俄羅斯當代後現代主義作家Viktor Pelevin說,所有的現代電影都是同一個主角:一個裝滿錢的公文包。從《死吻》的放射性物質公文包,到《低俗小說》裏面的那個類似的裏面金光閃閃的、不知道裝着什麼的公文包,從《魔頭對捕頭》(The Formula)的創世紀方程,到大衛·馬梅特(David Mamet)的《西班牙囚犯》(The Spanish Prisoner)裏面的祕密的金融處理,我們長期以來一直對有魔力的麥格芬(McGuffin,推動情節發展的對象或事件)感到癡迷。最近幾周,對TikTok算法的討論已經把它提升成了類似的東西,這個算法就好像是《奪寶奇兵》系列電影(如《法櫃奇兵》、《聖戰奇兵》…)裏面那些神祕的考古文物一樣。

但是這個領域大多數的專家的態度不會是這樣,他們不相信TikTok在機器學習推薦算法方面取得了迄今爲止我們所不知道的進步。實際上,大多數人會說,TikTok的做法大概跟別人的解決問題方法無異。

但是要記住的是,機器學習算法的有效性不僅僅取決於算法,還要取決於利用某些數據集訓練過後的算法。GPT3也許並沒有什麼新鮮,但是通過接受大規模的數據訓練,以及設置大量的參數,其輸出往往令人驚訝。

同樣地,基於自身數據集訓練過的TikTok FYP算法,在將視頻與認爲該視頻有趣的人進行匹配方面非常準確有效(而且,同樣重要的是,在不向那些不認爲視頻有趣的人推快遞方面也很有效)。

有些領域,比方說文本,可以輕鬆獲得大量訓練得很好的數據。比方說,要想訓練出像GPT3這樣的AI模型,你可以到互聯網、書籍等上面找到大量可用的文本集。如果你想訓練視覺AI,可以在網上和各種數據庫裏面找到大量照片。訓練仍然很費錢,但是至少你手頭有足夠的訓練數據。

但對於TikTok(或者抖音)來說,它那擅長推薦短視頻給受衆的算法可就沒有公開可用的這麼大規模的訓練數據集了。去哪裏可以找到模因、小孩跳舞、對口型、可愛的寵物、推銷品牌的網紅、士兵越障訓練、小孩模仿品牌等內容的短視頻呢就算你有這樣的視頻,又該去哪裏找到關於大衆對此類視頻感受的可比數據呢除了Musical.ly的數據集以外(主要是美國喜歡玩對口型的青少年),這樣的數據並不存在。

這是一個獨特的雞生蛋還是蛋生雞的問題,如果沒有這款app的的攝像頭工具和濾鏡,以及拿到版權的音樂剪輯的話,TikTok的算法需要訓練的那種視頻就很難創建。

那麼,這就是TikTok設計的魔力所在:app會激發和促進視頻的創作與瀏覽,算法然後用這些視頻進行訓練,再反過來激發和促進視頻的創作與瀏覽,形成反饋迴環。

爲了讓自己的算法發揮最大的效用,TikTok成爲了自己的訓練數據源。

以用戶中心Vs對算法友好

要了解TikTok是如何做出這麼強大的學習飛輪,我們需要對它的設計進行深入研究。

關於科技的UI設計,主導的思想流派(至少是我成長的過去二十年裏)關注的重點是消除用戶所做事情的摩擦,並讓他們在此過程中感到愉悅。其設計目標是優雅,什麼是優雅:優雅就是直觀、巧妙,甚至時尚。

也許沒有一家公司比蘋果把這種設計風格體現得更加淋漓盡致。巔峯狀態下的蘋果總能把自己的軟硬件做出優雅的感覺——“就是這麼好用(it just works)”,但同時又很迷人,讓用戶覺得很雅緻。(蘋果控制風格的名聲就沒那麼光彩了——手機、筆記本電腦不可替換的電池,目前有關應用商店規則的爭論)在發佈新品的主旨演講時,展示一塊硬邦邦的鋁塊是如何變成嶄新的MacBook Pro機身的視頻的理由是什麼因爲聽到工業激光把那塊鋁雕刻成一體化機身時發生的聲音很性感然後,當你在咖啡店用那臺筆記本電腦敲擊一封電子郵件時,在你的潛意識裏,有關那段視頻的一點殘留的記憶裏面會不會讓你的多巴胺受到一點點的觸動

這種以用戶爲中心的設計模式在這麼長時間以來一直佔據着主導地位是有原因的,尤其是在消費類技術裏面。首先,這的確有用。蘋果的市值最終超過了2萬億美元。(還記得假冒的Sean Parker說過十億美元很酷嗎那還是十年前,現在十億美元不再是金牛了。財富的量級在飛速發展。)此外,我們生活在大規模網絡效應時代,應用了Ben Thompson的聚合理論並獲得大量用戶羣的科技巨頭,可以在他們所參與的市場當中發揮出不可思議的槓桿作用。要先做到這一點,最佳的辦法之一就是設計出能比競爭對手更好地滿足用戶需求的產品和服務。

長期以來,這種設計流派一直佔據着主導地位,以至於我幾乎忘記了過去時代慣常採用過的一些蠻不講理的軟件設計了。(不要把它跟野獸派設計混爲一談,後者其實就像它在建築方面的表親一樣,在設計上是相當美的。)

但是,如果要想最大限度地服務好用戶的關鍵要取決於對機器學習算法的訓練呢如果這個ML算法需要龐大的訓練數據集該怎麼辦在機器學習方興未艾的時代,這日益成爲關鍵的設計目標。

在考慮如何設計app時,你日益必須考慮怎麼才能最好地幫助算法去“看”。爲了最大限度地服務好用戶,請先服務好你的算法。

TikTok讓我着迷,因爲不管是意外還是有意而爲之,這都是一個爲了儘可能多地給自己的算法提供有用信號的現代app的典範。這就是我所謂的算法友好型設計的範本。(我曾經想過把它叫做以算法爲中心的設計,但覺得這種說法有點過頭了。一個幫助算法看見東西的設計到頭來仍然是爲了給用戶提供儘可能好的體驗。)我們仍然可以認爲這只是以用戶爲中心的設計的一種變體,但是對於那些大量採用機器學習算法組件進行產品開發的團隊來說,明確地承認這一點也許有用。畢竟,當產品經理,設計師和工程師開會討論app設計時,算法是不會出席的。但是,對算法的訓練需求必須得到體現。

James Scott在談到《國家的視角》,談到了城市設計等領域的巨大變化,比如讓土地面積和業主數量對徵稅者“清晰可見”。TikTok的設計使得它的視頻、用戶和用戶首選項對For You Page算法清晰可見。這種app設計履行了它的主要職責之一:“像算法一樣看東西”。

我們不妨仔細看看。TikTok打開後就是“For You Page”頁面,然後直接進入視頻。這就是它的樣子。

這個是到目前爲止有史以來最熱門的TikTok視頻。截止到我發佈這篇文章時,它的34.1M個點贊可能已經不止了。你可以看看有關這條TikTok是如何誕生的故事,看過之後你仍然會覺得這是一個充滿悖論的文化難題,但是你看過後會喜歡的。我把這個給我侄女看了,然後我們一起循環播放了好幾十次,然後我們一起開始大喊“從M到B,從M到B”,然後一起笑了起來,這是我在這場疫情當中真正的感受不是絕望的少數幾次之一。

整個屏幕被一個視頻填滿。只有一個視頻。視頻用豎屏全屏顯示。注意,這是不能滾動的,而是分頁。視頻幾乎是立即自動播放(接下來的幾個視頻被加載到後臺,所以輪到的時候可以很快播放出來)。

這種設計讓用戶要面對一個緊迫的問題:你對這個短視頻的感覺如何就這個短視頻。

從視頻開始播放到現在,你所做的一切都是你對該視頻的感受的信號。你是不是在它還沒播放完就滑向了下一個視頻是的話就隱含(儘管邊界是顯性的)表示你對它不感興趣。

你是不是看了不止一次,讓它循環播放了好幾次似乎不知怎的它就吸引了你。你有沒有通過內置的分享面板分享了這段視頻這是正面情緒的另一個有力指標。如果你點擊右下角旋轉的LP圖標,看了更多有着同樣背景音樂的視頻的話,就是該視頻對你胃口的進一步信號。音樂線索往往是模因的代名詞,現在TikTok又有了一條爲你推薦視頻的軸線了。還有,你是不是跑去看了看視頻創作者的個人資料頁面你是不是看過她其他的視頻,然後還關注了對方是的話說明你除了欣賞視頻以外,也許你還特別欣賞對方這個人。

但是,我們不妨再退後一步,看看這你還沒有看到這個視頻之前,TikTok的算法自己是怎麼“看見”這個視頻的。在這個視頻通過FYP算法發國際快遞你的手機之前,TikTok的運營團隊有人已經看了這個視頻,並添加了大量相關標籤或標記。

這個視頻是跟跳舞有關的嗎是對口型還是視頻遊戲有小貓嗎還是花栗鼠是搞笑的嗎主體是男的還是女的大概幾歲是羣視頻嗎背景在哪裏用的是什麼濾鏡或視覺效果如果裏面包括有食物,是什麼食物等等。所有這些標籤都成爲了算法現在可以看到的功能。

視頻還要在視覺AI這裏處理一下,併爲自己能看到的東西做出貢獻。TikTok有些攝像頭濾鏡能夠跟蹤人臉、手或者手勢,所以視覺AI往往在視頻被創建出來之前就被調用過了。

這個算法還可以看到TikTok所瞭解到的有關你的信息。你過去喜歡什麼類型的視頻有關你的人口統計學信息或心理學信息有哪些你是在哪裏看這個視頻的你用的是什麼類型的設備等等。除此之外,還有哪些其他用戶跟你相似

譯者:boxi。


文章推薦
WhatsApp功能小技巧,whatsapp建羣技巧
TikTok廣告投放實際操作如何,tiktok廣告投放技巧
在國內京東淘寶購物轉運到墨爾本要多少錢,墨爾本直郵到國內多少郵費
Unity Ads調節常見問題解答,unity怎麼快速恢復視角


特別聲明:以上文章內容僅代表作者本人觀點,不代表ESG跨境電商觀點或立場。如有關於作品內容、版權或其它問題請於作品發表後的30日內與ESG跨境電商聯繫。