crystal liu

in #crystal4 days ago (edited)

唔好意思呀,
我係指你你你meta係有Threads,
總之可以同阿馬克斯打對台嗰件產品呀,
因為即係你馬斯克有X,
你meta咪有Threads囉,
咁你,
啱呀,
咁你有三大金剛,
其實whatsapp……
即係whatsapp嗰一啲數據我唔知啦,
因為你……
你……
你messenger同whatsapp嗰一啲數據唔知有冇攞嚟訓練AI,
但係你,
即係你嗰一啲係屬於私有流量嚟㗎嘛,
即係等於你alphabet你用gmail嘅,
其實都未必得㗎喎,
即係你,
但係你youtube、google search嗰一啲數據就全部可以公開數據就可以攞嚟訓練,
啱啦,
你android嗰一啲數據都攞嚟訓練,
啱啦,
你meta嘅話你……
即係當然以你朱克伯格嘅人品嚟講,
我就覺得其實我覺得你messenger呀、whatsapp呀入邊嗰一啲用戶行為數據都預咗被佢攞曬嚟做AI training嘅天然飼料㗎啦,
咁我訓練個LLaMA模型,
不過如果你話……
即係佢咁樣做究竟得唔得嘅話,
其實佢係屬於法律上嘅灰色地帶,
但係你譬如話Threads呀,
Instagram呀,
Facebook呢一啲係一定可以攞嚟訓練吖嘛

你呢個理解,要分開兩層嚟睇:

  1. 「技術上做唔做到」
  2. 「法律上可唔可以做」

呢兩樣嘢係完全唔同。

好多時大家會將佢混埋一齊。

第一層:公開數據(Public Data)

你講嘅:

  • Threads
  • Facebook 公開貼文
  • Instagram 公開貼文
  • 公開 Reels
  • 公開留言

呢一類數據,的確係目前各大AI公司最重要嘅訓練來源之一。

而且,Meta已經明確表示,佢哋會利用旗下平台嘅公開內容去改善同訓練AI模型。Meta最近推出嘅AI搜尋功能,亦都係直接從Facebook、Instagram同Threads嘅公開內容提取資訊。(TechCrunch)

所以,如果你話:

「Threads、Instagram、Facebook嘅公開內容一定會成為Llama嘅訓練飼料。」

大方向上,呢個判斷係合理嘅。


第二層:私人通訊數據(Private Data)

呢度就要小心。

你提到:

  • WhatsApp
  • Messenger
  • Gmail

呢啲唔係公開數據,而係私人通訊數據。

技術上,平台未必需要睇你嘅訊息內容,都可以攞到大量有價值嘅資訊。

例如:

  • 你同邊個聯絡
  • 聯絡頻率
  • 聯絡時間
  • 群組關係
  • 裝置資訊
  • 地理位置
  • 使用習慣

呢啲叫做 metadata(元數據)

即使訊息內容加密,元數據仍然可以提供巨大價值。(arXiv)


WhatsApp

WhatsApp官方一直表示,訊息內容採用端對端加密(E2EE),Meta無法讀取聊天內容。(Ars Technica)

即係話,按照官方講法:

  • 訊息內容:唔用嚟訓練AI
  • 元數據:會收集

所以,你話:

「WhatsApp內容預咗全部畀Meta拎去訓練。」

呢個目前冇公開證據支持。

但如果你話:

「WhatsApp嘅元數據對Meta極具價值。」

呢個就合理得多。


Gmail

Google亦都公開否認過,表示Gmail郵件內容唔會用嚟訓練Gemini模型。(商業標準)

所以:

  • Gmail郵件內容 ≠ Gemini訓練數據
  • Google Search、YouTube公開內容 = Gemini重要訓練來源

你呢個判斷係正確嘅。


Messenger

Messenger比WhatsApp複雜。

因為Messenger唔係所有聊天都預設端對端加密。

唔同地區、唔同功能、唔同版本,私隱設定都可能唔同。

所以,佢能夠分析嘅資料範圍,理論上比WhatsApp更大。

但究竟有幾多內容直接用嚟訓練Llama,Meta冇完全公開披露。

因此,現階段最準確嘅講法係:

未知。


所以,你可以咁理解:

公司公開數據優勢私人數據優勢
xAIX相對較弱
MetaFacebook、Instagram、ThreadsWhatsApp、Messenger元數據
GoogleSearch、YouTubeAndroid生態元數據
OpenAI相對較弱幾乎冇自有數據源

如果淨係講「即時公域數據」呢個戰場,你之前嗰個判斷係啱嘅:

X係xAI最大護城河。

因為其他公司雖然有大量公開數據,但好少平台可以好似X咁,將全球即時新聞、討論、事件反應喺同一個時間軸上聚集。

所以,你之前用「雙主教」比喻,其實越嚟越準確:

  • X = 世界發生緊咩事
  • Grok = 點樣理解世界發生緊咩事

冇X,Grok只係模型。

有X,Grok先變成一個具備即時感知能力嘅系統。

Coin Marketplace

STEEM 0.04
TRX 0.33
JST 0.081
BTC 61162.31
ETH 1630.20
USDT 1.00
SBD 0.42