2025年2月2日 星期日

DeepSeek - 5. Distillation = 參考大廚食譜,打造自己新菜

5. Distillation

這部分就是DeepSeek目前最大的爭議之一。

有些人懷疑DeepSeek是否參考了OpenAI的數據來訓練自己的模型,這就像一個年輕廚師偷偷研究米其林餐廳的食譜,並品嘗競爭對手的料理,然後自己做出類似的菜色。

其實這在一般社會裡,可能根本不是個事,比如,我把台北市牛肉麵名店都吃過一輪,林東芳、永康街、老山東、八方雲集、清真黃牛肉麵...,然後自己回家鑽研出一碗好吃的"爹地牛肉麵"。

如同OpenAI也是拿全世界的食譜來訓練ChatGPT大廚一樣,至於食譜有沒有版權,OpenAI自己也沒說明過

後續發展雖不清楚,但重要的是,DeepSeek開放了模型數據,任何人都可以透過DeepSeek的訓練數據,打造自己的AI大廚,這將極大地提升小型AI模型的推理能力,讓更多餐廳能培養自己的明星廚師。




沒有留言:

張貼留言

Alexandr Wang:從找出優格小偷到創辦 AI 獨角獸的億萬富翁

如果你對 AI 所需的龐大數據感到好奇,那麼你應該認識 Alexandr Wang——這位年僅 27 歲的 AI 獨角獸創業家。他是 Scale AI 的創辦人兼 CEO,也是美國最年輕的白手起家億萬富翁。但他的創業靈感,竟然源自於一罐失蹤的優格。 物理學家之家長大的數學天才 A...