Yao Shunyu: ทำไมถึงออกจาก Anthropic ไป Google DeepMind

สรุปบทสัมภาษณ์ Yao Shunyu (ex-Anthropic → Google DeepMind) — ภาพรวม Q1 2026, pretraining, coding, มุมจีน vs สหรัฐ, และสิ่งที่เขาเดิมพันตอนนี้

Nutchanon Yongsatianchot, Ph.D. 12 พ.ค. 2569 2 min read

Yao Shunyu: ทำไมถึงออกจาก Anthropic ไป Google DeepMind

Interview อันนี้น่าสนใจดี — Yao Shunyu เคยอยู่ Anthropic มาก่อน ก่อนจะย้ายไป Google DeepMind โดยเหตุผลหลักๆ คือไม่โอเคกับ Dario ที่ไม่ชอบจีนอย่างมาก

Channel นี้ interview เป็นภาษาจีน และยาวมากกก (3 ชม.++) ตลอด เลยสรุป (AI + คน) มาให้เพื่อใครสนใจด้านล่าง

⚡ ภาพรวมวงการ AI ตอน Q1 2026

ตัวเลขบน benchmarks (SWE-bench, AIME, IMO) ของ Anthropic, OpenAI, Gemini ใกล้กันหมดแล้ว ห่างกันแค่ noise — ปัญหาหลักไม่ใช่ "ทำได้ไหม" อีกต่อไป แต่เป็น "นิยามโจทย์ยังไงให้ดี" เพื่อให้โมเดลทำได้

การใช้งานจริงยังพอแยกได้:

Claude — ดีสุดเรื่อง general tool-use / agent
Codex — ตามทันเรื่อง pure coding แล้ว
Gemini — แรงสุดเรื่อง reasoning และคำถามรายวัน

🚀 Pretraining ยังไม่ตาย

เขาเถียงสุดตัวว่าคนที่บอก "scaling law ชนกำแพง" ส่วนใหญ่คือ "มี bug ที่ตัวเองไม่เจอ" ไม่ใช่กำแพงจริง 4 เดือนที่ผ่านมาที่ Google เห็นว่ายังไปต่อได้ ไม่มีวี่แววจบ

💻 ทำไม coding มาก่อน

สองเหตุผลใหญ่:

Reward signal ที่ชัดเจน — เทสต์ input/output ได้ตรงๆ
ข้อมูล GitHub สะสมมาเป็นสิบปี โดย engineer ที่ดี

ส่วนตัวเขาเอง code 90% (conservative) ถึง 99% มาจาก AI หมด ทำ experiment เร็วขึ้น 20-50 เท่าเทียบกับ 18 เดือนก่อน แต่ทำงานมากขึ้น เพราะมีไอเดียให้ลองเยอะกว่าเดิม

Google ไม่ใช่ Google ที่ Work-life balance แล้ว — ในยุค GenAI ไม่มีใครชิลล์

🏢 ทำไม Anthropic ทำสำเร็จเรื่อง coding

Anthropic เป็นองค์กร top-down ที่ technical leader (Jared Kaplan, Sam McCandlish) เป็น cofounder จริงๆ ตัดสินใจเร็ว เดิมพันได้แรง แล้วทุกคน founding team ยังอยู่ครบ เพราะร่วมเขียน Scaling Laws กับ GPT-3 paper สมัยอยู่ OpenAI ด้วยกัน

ส่วน OpenAI ทำแบบเดียวกันไม่ได้ — เขาบอกตรงๆ ว่า "ขนาดทีม founding ตัวเองยังจัดการไม่อยู่ จะคุมบริษัทใหญ่ได้ยังไง" 😅

จุดเริ่ม coding bet ของ Anthropic จริงๆ คือ random — ตอน Claude 3 ออก Twitter บอกว่าเขียน code ดีกว่า GPT-4 บริษัทก็ react เร็ว เทหมดหน้าตักเลย

🌊 ทำไมเขาออกจาก Anthropic

~40% เพราะไม่เห็นด้วยกับท่าทีต่อต้านจีนของ Dario — คิดว่าสุดโต่งเกินไปสำหรับท่าทีของ CEO
วัฒนธรรมเสียตอนคนเพิ่มเป็น 2,000+ คน — เริ่มเป็นพวก "Slack philosopher" พูดเยอะกว่าทำ
อยากเรียนเรื่องที่ Anthropic ไม่ทำ เช่น multimodal generation, low-level infra

ตอนออกก็ bearish กับ Anthropic เพราะคิดว่าธุรกิจขาย API อย่างเดียวสุดท้ายต้องสู้สงครามราคา ที่ Google ชนะอย่างเดียว แต่ยอมรับว่าคิดผิด — Claude Code กับ Cowork ช่วยพยุงไว้ได้

🔄 Google DeepMind เปลี่ยนยังไง

ก่อนหน้านี้คือ chaos ตอนนี้ pretraining กลายเป็น "engineering project ที่กำหนดได้" ทุก node มีเจ้าของชัด

คนตัดสินใจหลังบ้านคือ Sergey Brin แนวหน้าจริงๆ คือ Koray Kavukcuoglu (DeepMind CTO + Google SVP) ไม่ใช่ Demis ที่โฟกัสไปทาง Isomorphic Labs / science มากกว่า

ที่ Gemini แซง OpenAI ได้เพราะสองเหตุการณ์ต่อกัน — Nano Banana ดึงคนเข้าแอป + Gemini 3 รักษาคนไว้ ถ้ามี Gemini 3 อย่างเดียวขยับยาก เพราะ market share ต่ำกว่า 10%

มุมมองเขา: OpenAI ช่วยชีวิต Google โดยบังเอิญ — ที่ chatbot กิน search ได้บางส่วนแต่ไม่ฆ่าตาย ทำให้ Google มีเวลาไล่ตามทัน

🎯 สิ่งที่เขาเดิมพันตอนนี้

ML coding ให้ AI ทำ AI research ครบ loop (เขียน code → run → วิเคราะห์ผล → ตั้งสมมติฐานใหม่) คาดว่า loop ปิดสมบูรณ์ใน 6-12 เดือน
Long horizon agent — สโลแกนคือ "train with finite context, use as infinite context" ให้โมเดลเลือกจำ/ลืมเองได้แบบที่มนุษย์ทำ

🇨🇳 มุมจีน vs สหรัฐ

Gap ปิดเรื่อยๆ — จีนถูกบังคับให้เก่งเพราะ compute น้อย
"Hard distillation" (ดูดโทเคนคู่แข่งมา train ตรงๆ) เขาว่า "โง่ ไม่ซื่อ ดูออกเลยว่าไม่รู้ตัวเองอยากทำอะไร"
"Smart distillation" (ใช้คู่แข่งเป็น evaluator ใน pipeline ตัวเอง) เทาๆ ทาง business แต่เจ๋งทาง technical — ทำให้ lab จีนกลายเป็นผู้บุกเบิก Multi-Agent training โดยบังเอิญ
Yao บอกว่า (ชื่อโดน bleeped) มีหนึ่งแลบที่ hard distillation
ByteDance distill น้อยสุด มีจุดเด่นจริง โดยเฉพาะ voice ของ Doubao — "ดีสุดในโลก" ที่ไม่ใช่ "ดีที่สุดในโลก" แบบถ่อมตัว

📌 คำถามสัมภาษณ์ที่เขาใช้คัดคน

ให้ทำ RL project ครบ loop ใน 24 ชม. เลือก model / data / algorithm / train เอง แล้วคุยกัน 1 ชม.

เช็คว่าใช้ AI ทำงานเป็นไหม ไม่ใช่ดูว่าเขียน code เก่งแค่ไหน (ไม่มีใครเขียนเองแล้ว)
กับดัก — ถ้าโยนให้ AI ทำหมดโดยไม่เข้าใจ จะโดนจับได้ใน 1 ชม. ที่คุยกัน
Dark secret: ที่ให้ 24 ชม. คือเช็คว่าอยากได้งานแค่ไหน อดนอนไหวไหม

⚠️ ความเห็นแรงของเขา

"Pure language modeling รถไฟเที่ยวสุดท้ายออกแล้ว" — รุ่นใหม่ตอนนี้ไปลงที่ multimodal generation, robotics (ยังก่อนยุค GPT-1 อยู่เลย), AI for science แทน
Anthropic เชื่อว่า "ถ้าเรามีโมเดลที่ดีที่สุดจะกำหนด safety ได้" — เขาว่า naive ทางที่ใช้ได้จริงคือแบบ nuclear deterrence หลายฝ่ายมี capability สมดุลกัน
xAI? "ไม่เข้าใจ วุ่นวายตลอด คนที่รู้จักก็ออกไปหมดแล้ว"
AI doing AI research จะเกิดขึ้นจริงจังในอีก 6-12 เดือนข้างหน้า

ที่มา: https://www.youtube.com/watch?v=ttkd0t5qTD4

Reactions

Share Facebook X