5. Distillation
這部分就是DeepSeek目前最大的爭議之一。
有些人懷疑DeepSeek是否參考了OpenAI的數據來訓練自己的模型,這就像一個年輕廚師偷偷研究米其林餐廳的食譜,並品嘗競爭對手的料理,然後自己做出類似的菜色。
其實這在一般社會裡,可能根本不是個事,比如,我把台北市牛肉麵名店都吃過一輪,林東芳、永康街、老山東、八方雲集、清真黃牛肉麵...,然後自己回家鑽研出一碗好吃的"爹地牛肉麵"。
如同OpenAI也是拿全世界的食譜來訓練ChatGPT大廚一樣,至於食譜有沒有版權,OpenAI自己也沒說明過。
後續發展雖不清楚,但重要的是,DeepSeek開放了模型數據,任何人都可以透過DeepSeek的訓練數據,打造自己的AI大廚,這將極大地提升小型AI模型的推理能力,讓更多餐廳能培養自己的明星廚師。

沒有留言:
張貼留言