TradingKey - เมื่อวันอังคารที่ 2 มิถุนายน ตามเวลาตะวันออก Microsoft ( MSFT ) ได้เปิดฉากการประชุมนักพัฒนาประจำปีในชื่อ Build ณ ศูนย์ Fort Mason Center ในซานฟรานซิสโก ซึ่งถือเป็นครั้งแรกที่การประชุมย้ายออกจากฐานที่มั่นเดิมในซีแอตเทิลนับตั้งแต่ปี 2016 แม้ขนาดของงานจะถูกปรับลดลงเหลือผู้เข้าร่วมประมาณ 2,500 คน แต่สัญญาณที่ส่งออกมากลับสร้างแรงสั่นสะเทือนครั้งใหญ่ โดย Microsoft กำลังพยายามนิยาม Windows ใหม่ จากการเป็นระบบปฏิบัติการสำหรับมนุษย์ไปสู่สภาพแวดล้อมการทำงานแบบเนทีฟ (native runtime environment) สำหรับเอไอเอเยนต์ (AI agents) ซึ่งเป็นการผลักดัน AI จากระยะของการ "ช่วยเหลืองานของมนุษย์" ไปสู่เฟสใหม่ของการ "ปฏิบัติภารกิจแทนมนุษย์"
ภายในการประชุมที่ได้รับความสนใจอย่างสูงนี้ Microsoft ได้เปิดตัวโมเดล AI ใหม่ถึง 7 รุ่นพร้อมกัน ซึ่งครอบคลุมด้านหลักๆ เช่น การใช้เหตุผล การเขียนโค้ด การมองเห็น และมัลติโมดัล (multimodality) ซึ่งเป็นสัญญาณว่ากลยุทธ์ "อิสระ" (autonomy) ของ AI ของบริษัทได้เข้าสู่ระยะการนำไปใช้งานจริงที่สำคัญแล้ว
Mustafa Suleyman หัวหน้าฝ่าย Microsoft AI ระบุอย่างชัดเจนว่า Microsoft กำลังสร้างเส้นทางการพัฒนาที่แตกต่างจาก Google ( GOOGL ), Meta ( META ), และ OpenAI.
เขาเน้นย้ำว่า: "เราให้ความสำคัญกับแนวทางในสไตล์ Anthropic มากกว่า ซึ่งก็คือตลาดองค์กร นักพัฒนา และการเขียนโค้ด" ในขณะที่ยังคงสานต่อความร่วมมืออย่างลึกซึ้งกับ OpenAI อย่างต่อเนื่อง Microsoft ก็กำลังเร่งสร้างระบบนิเวศเทคโนโลยี AI ของตนเอง โดยเฉพาะการสร้างความได้เปรียบทางการแข่งขันในด้านแอปพลิเคชันสำหรับองค์กร เครื่องมือนักพัฒนา และสถานการณ์การเขียนโปรแกรมต่างๆ
Microsoft เปิดตัวโมเดล AI ใหม่พร้อมกัน 7 โมเดล ซึ่งทั้งหมดรวมอยู่ในตระกูล MAI (Microsoft AI) โดยครอบคลุมความสามารถครบวงจร ทั้งการให้เหตุผล การเขียนโค้ด การมองเห็น เสียง และมัลติโมดัล ซึ่งถือเป็นช่วงสำคัญของการดำเนินกลยุทธ์ "ความเป็นอิสระ" (autonomy) ของ AI จาก Microsoft
Microsoft นิยามโมเดลซีรีส์นี้ว่าเป็นส่วนประกอบหลักของ "เครื่องจักรปีนเขา" (hill-climbing machine) ซึ่งจะพัฒนาตนเองอย่างต่อเนื่องผ่านการลงทุนในทรัพยากรการประมวลผล การเพิ่มประสิทธิภาพข้อมูลฝึกฝน และระบบประเมินผลที่ละเอียดแม่นยำ เพื่อให้มั่นใจว่าผู้ใช้งานจะยังคงเป็นผู้นำด้านเทคโนโลยีอยู่เสมอ
โมเดลทั้ง 7 ที่เปิดตัวในครั้งนี้ไม่ได้มุ่งเน้นเพียงแค่ขนาดของพารามิเตอร์ แต่มีเป้าหมายเพื่อสร้างชุดความสามารถ "การคิด การให้เหตุผล การดำเนินการ และการเขียนโค้ด" ที่สมบูรณ์เพื่อรองรับระบบเอเจนต์ AI รุ่นต่อไป
ผลิตภัณฑ์หลักประกอบด้วยโมเดลการให้เหตุผลตระกูล MAI Thinking, โมเดลเขียนโค้ดประสิทธิภาพสูง, โมเดลการมองเห็นและมัลติโมดัล, โมเดลน้ำหนักเบาสำหรับระบบเอเจนต์ และโมเดลเฉพาะทางที่ปรับแต่งมาเพื่อองค์กรและนักพัฒนา
ผลิตภัณฑ์ที่ถูกจับตามองมากที่สุด 2 รายการ ได้แก่ MAI-Thinking-1 ซึ่งเป็นโมเดลการให้เหตุผลระดับเรือธงรุ่นแรกของ Microsoft และ MAI-Code-1-Flash โมเดลการเขียนโค้ดประสิทธิภาพสูงที่พัฒนาขึ้นสำหรับ GitHub โดยเฉพาะ
ในฐานะอาวุธสำคัญในกลยุทธ์ตลาด AI ระดับองค์กรของ Microsoft โมเดล MAI-Code-1-Flash ได้รับการฝึกฝนด้วยชุดข้อมูลที่ "สะอาดและได้รับอนุญาต" (clean and licensed) และกำลังทยอยเปิดให้ผู้ใช้งาน GitHub Copilot ใน VS Code ได้ใช้งาน
ผู้ใช้งานสามารถเลือกสลับไปใช้โมเดลดังกล่าวได้ด้วยตนเองผ่านเมนูการเลือกโมเดล หรือให้ระบบอัจฉริยะเลือกโมเดลที่เหมาะสมที่สุดตามความซับซ้อนของงานโดยอัตโนมัติ
นอกจาก MAI-Code-1-Flash แล้ว โมเดลการให้เหตุผล MAI-Thinking-1 ของ Microsoft ก็น่าจับตามองเช่นกัน โดยการประกาศที่สำคัญที่สุดคือการเปิดตัวตระกูลโมเดลการให้เหตุผลครั้งแรกภายใต้ชื่อ MAI Thinking
โมเดลการให้เหตุผลกำลังกลายเป็นสมรภูมิการแข่งขันด้าน AI ในปี 2026 ซึ่งแตกต่างจากโมเดลแชททั่วไปที่เน้นการโต้ตอบด้วยภาษาธรรมชาติ แต่โมเดลประเภทนี้จะเน้นการคิดเชิงตรรกะ การย่อยปัญหาซับซ้อนเป็นขั้นตอน การวางแผนงานระยะยาว การให้เหตุผลทางคณิตศาสตร์และโค้ด รวมถึงการสนับสนุนการทำงานที่เป็นอิสระของระบบเอเจนต์ ซึ่งตอบโจทย์หลักของแอปพลิเคชันระดับองค์กร และเป็นจุดยุทธศาสตร์สำคัญสำหรับยักษ์ใหญ่ด้านเทคโนโลยี
MAI-Thinking-1 ของ Microsoft มุ่งเป้าไปที่ตลาดนี้โดยตรง โดยข้อมูลระบุว่าประสิทธิภาพของโมเดลขนาดกลางรุ่นนี้ในการทดสอบมาตรฐานวิศวกรรมซอฟต์แวร์เทียบเท่ากับโมเดลชั้นนำในอุตสาหกรรม โดยเฉพาะความสามารถในการเขียนโค้ดที่ใกล้เคียงกับ Claude Sonnet 4.6
Mustafa Suleyman หัวหน้าฝ่าย Microsoft AI ยอมรับในการให้สัมภาษณ์กับสื่อว่า Anthropic ยังคงนำหน้าอยู่หลายเดือน แต่เน้นย้ำว่า Microsoft กำลังลดช่องว่างลงด้วยความเร็วที่น่าทึ่ง และมีความก้าวหน้าแบบก้าวกระโดดในช่วงหกเดือนที่ผ่านมา
เมื่อพิจารณาจากสถาปัตยกรรมทางเทคนิค ปรัชญาการออกแบบของ MAI-Thinking-1 มีความคล้ายคลึงกับซีรีส์ Claude ของ Anthropic อย่างมาก โดยหลีกเลี่ยงการแข่งขันที่ขนาดพารามิเตอร์เพียงอย่างเดียว แต่หันมาเน้นที่ความสามารถในการให้เหตุผลและการใช้งานจริงอย่างมีประสิทธิภาพ แนวทางนี้ช่วยให้โมเดลจัดการกับงานซับซ้อนได้ดียิ่งขึ้นในขณะที่ลดต้นทุนในการใช้งาน ทำให้เหมาะสมกับแอปพลิเคชันระดับองค์กรขนาดใหญ่
ในขณะเดียวกัน Microsoft ได้เปิดตัว Majorana 2 ซึ่งเป็นชิปควอนตัมรุ่นถัดไปอย่างเป็นทางการ โดยชิปดังกล่าวเป็นรุ่นต่อยอดจากโปรเจกต์ Majorana ที่เคยสร้างข้อพิพาทในอุตสาหกรรมเมื่อปีที่แล้ว และถือเป็นก้าวสำคัญล่าสุดในความมุ่งมั่นตลอด 20 ปีของ Microsoft ต่อโรดแมป "topological qubit" ทั้งนี้ Microsoft ได้แยกทางจากแนวทางควอนตัมแบบตัวนำยิ่งยวดที่บริษัทยักษ์ใหญ่อย่าง Google และ IBM กำลังดำเนินการอยู่ และเลือกใช้เส้นทางทางเทคนิคที่ท้าทายยิ่งกว่า นั่นคือการใช้ Majorana quasiparticles เพื่อสร้างคิวบิตที่ทนทานต่อสัญญาณรบกวนโดยธรรมชาติ
ในแง่ของคุณสมบัติทางเทคนิค การปรับปรุงใน Majorana 2 ถือเป็นการปฏิวัติวงการ โดยจำนวนคิวบิตบนชิปเพิ่มขึ้นจาก 8 คิวบิตในรุ่นก่อนหน้าเป็น 12 คิวบิต ทว่าความก้าวหน้าที่แท้จริงอยู่ที่ความเสถียรของคิวบิต ข้อมูลที่เปิดเผยโดย Microsoft ระบุว่า อายุการใช้งานเฉลี่ยของคิวบิตในชิปรุ่นใหม่นี้เกินกว่า 20 วินาที และบางส่วนสามารถอยู่ได้นานกว่าหนึ่งนาที ในขณะที่ผลิตภัณฑ์รุ่นแรกที่เปิดตัวเมื่อปีที่แล้วมีอายุการใช้งานไม่ถึง 12 มิลลิวินาที ซึ่งสะท้อนถึงความน่าเชื่อถือที่เพิ่มขึ้นกว่า 1,000 เท่า โดย Microsoft เปรียบเทียบความก้าวหน้านี้ว่าเหมือนกับ "การเปลี่ยนแบตเตอรี่โทรศัพท์ที่ใช้งานได้เพียงหนึ่งวันเป็นแบตเตอรี่ที่ใช้งานได้นานเกือบสามปี"
Majorana 2 ได้เปลี่ยนจากการใช้สารตัวนำยิ่งยวดที่มีอะลูมิเนียมเป็นหลักซึ่งใช้ในรุ่นก่อนหน้า มาเป็นการใช้สารตัวนำยิ่งยวดที่มีตะกั่วเป็นพื้นฐาน และปรับปรุงส่วนกึ่งตัวนำแอคทีฟให้เป็นการผสมผสานระหว่างอินเดียมอาร์เซไนด์และอินเดียมแอนติโมไนด์ การจัดเรียงวัสดุแบบใหม่นี้ช่วยสร้างสถานะทอพอโลยีที่มีเสถียรภาพมากขึ้น ซึ่งช่วยเสริมสร้างความทนทานของคิวบิตต่อสัญญาณรบกวนจากสิ่งแวดล้อมได้อย่างมีนัยสำคัญ
Chetan Nayak นักวิจัยและผู้บริหารแผนกฮาร์ดแวร์ควอนตัมของ Microsoft ระบุว่า ความก้าวหน้านี้ทำให้บริษัทมีความมั่นใจที่จะลดระยะเวลาการวิจัยและพัฒนาคอมพิวเตอร์ควอนตัมที่ใช้งานได้จริงลงครึ่งหนึ่ง โดยเลื่อนเป้าหมายให้เร็วขึ้นจากปี 2035 มาเป็นปี 2029
เป็นที่น่าสังเกตว่า กระบวนการวิจัยและพัฒนา Majorana 2 ทั้งหมดใช้การออกแบบที่ได้รับความช่วยเหลือจาก AI โดยทีมวิจัยได้ใช้ Microsoft Discovery agent ในการเร่งการคัดกรองวัสดุและการเพิ่มประสิทธิภาพสถาปัตยกรรม ซึ่งช่วยย่นระยะเวลาในวงจรการพัฒนาที่ปกติแล้วต้องใช้เวลานานหลายปีลงได้อย่างมาก
Microsoft ไม่เพียงแต่แสดงความก้าวหน้าครั้งสำคัญในด้านควอนตัมคอมพิวเตอร์เท่านั้น แต่ยังเปิดตัวผลิตภัณฑ์ที่พลิกโฉมอุตสาหกรรมในด้านเอไอเอเจนท์ (AI agents) อย่าง Web IQ
ชุด API สำหรับการค้นหานี้ได้รับการออกแบบมาโดยเฉพาะสำหรับเอไอเอเจนท์ โดยมีการปรับโครงสร้างสถาปัตยกรรมพื้นฐานใหม่โดยอาศัยความเชี่ยวชาญทางเทคนิคกว่าสองทศวรรษของ Bing โดยมีเป้าหมายเพื่อแก้ไขปัญหาด้านต้นทุนที่สูงและการตอบสนองที่ล่าช้าในการค้นหาข้อมูลของแอปพลิเคชัน AI ในปัจจุบัน พร้อมทำหน้าที่เป็น "รากฐานข้อมูล" สำหรับยุคแห่งเอไอเอเจนท์
Web IQ แตกต่างจากเครื่องมือค้นหาแบบดั้งเดิมตรงที่ให้บริการแก่เอไอเอเจนท์แทนที่จะเป็นผู้ใช้ที่เป็นมนุษย์ โดย Jordi Ribas ประธานฝ่าย Microsoft Search and AI อธิบายในการให้สัมภาษณ์ว่า ในขณะที่การค้นหาโดยมนุษย์ต้องการให้เครื่องมือจัดลำดับและแสดงผลลัพธ์ แต่เอไอเอเจนท์ต้องการข้อมูลที่มีโครงสร้างและสรุปความอย่างกระชับเพื่อการประมวลผลและการใช้งานที่รวดเร็วโดยไม่ต้องใช้โทเคนมากเกินไป ดังนั้น Web IQ จึงได้สร้างสถาปัตยกรรมใหม่ทั้งหมดตั้งแต่ต้น โดยใช้ประโยชน์จากความเชี่ยวชาญทางเทคนิคที่สะสมมานานกว่ายี่สิบปีของ Bing เพื่อให้บริการค้นหา "ที่ออกแบบมาเฉพาะ" สำหรับเอไอเอเจนท์
จากข้อมูลอย่างเป็นทางการที่ Microsoft เปิดเผย ระบุว่า 95% ของคำขอสามารถตอบสนองได้ภายใน 165 มิลลิวินาที ซึ่งเร็วกว่าคู่แข่งในอุตสาหกรรมโดยเฉลี่ยประมาณ 2.5 เท่า และด้วยเทคโนโลยี grounding ข้อมูลที่ส่งกลับมาจึงมีความกระชับมากขึ้น ช่วยลดการใช้โทเคนลงได้ถึง 60% เมื่อเทียบกับ API การค้นหาแบบดั้งเดิม
ดัชนีชี้วัดประสิทธิภาพนี้มีความสำคัญอย่างยิ่งในสภาพแวดล้อมแอปพลิเคชัน AI ปัจจุบัน รายงานของ McKinsey สำหรับไตรมาสแรกของปี 2026 ระบุว่าการใช้โทเคนที่เกี่ยวข้องกับการค้นหามีสัดส่วนถึง 35% ของต้นทุนรวมในแอปพลิเคชัน AI และกรณีที่ความหน่วงในการตอบสนองเกิน 300 มิลลิวินาทีมีสัดส่วนถึง 40% ซึ่งกลายเป็นคอขวดหลักที่ส่งผลต่อประสบการณ์การใช้งานเอไอเอเจนท์
ขีดความสามารถหลักของ Web IQ อยู่ที่ฟังก์ชัน grounding อันทรงพลัง ซึ่งช่วยให้เอไอเอเจนท์ได้รับข้อมูลอินเทอร์เน็ตที่เชื่อถือได้และเป็นเรียลไทม์ ทั้งข่าวสารล่าสุด ราคาแบบเรียลไทม์ สินค้าคงคลังแบบไดนามิก เนื้อหาเว็บ เอกสารประกอบ API และข้อมูลองค์กร จึงช่วยลดปัญหาข้อมูลที่ AI สร้างขึ้นเองอย่างไม่ถูกต้อง (AI hallucination) ได้อย่างมีประสิทธิภาพ
ที่สำคัญยิ่งกว่านั้น Web IQ ไม่เพียงแต่ส่งกลับเนื้อหาเว็บเท่านั้น แต่ยังให้โครงสร้างข้อมูลที่สามารถสั่งการได้ ช่วยให้เอไอเอเจนท์สามารถเรียกใช้บริการบนเว็บไซต์ได้โดยตรง ทำธุรกรรมให้เสร็จสิ้นโดยอัตโนมัติ เข้าใจความหมายทางภาษาของหน้าเว็บ ใช้งานเครื่องมือออนไลน์ และแม้กระทั่งทำงานร่วมกับเอไอเอเจนท์ภายนอก การออกแบบนี้สอดคล้องอย่างมากกับกลยุทธ์ Model Context Protocol (MCP) ที่ Microsoft ผลักดันก่อนหน้านี้ ซึ่งส่งสัญญาณถึงวิวัฒนาการของอินเทอร์เน็ตจากการที่ "เบราว์เซอร์อ่านหน้าเว็บ" ไปสู่การที่ "เอไอเอเจนท์อ่านบริการ"
ในช่วง 4 ปีที่ผ่านมา Microsoft ได้ทุ่มเดิมพันด้าน AI เกือบทั้งหมดไปกับความร่วมมือกับ OpenAI โดยเริ่มตั้งแต่ Copilot ไปจนถึง Azure AI และจากบริการสำหรับองค์กรไปจนถึงแอปพลิเคชันสำหรับผู้บริโภค เทคโนโลยีโมเดลของ OpenAI ได้กลายเป็นโครงสร้างหลักของขีดความสามารถด้าน AI ของ Microsoft อย่างไรก็ตาม ในขณะที่ความร่วมมือดังกล่าวเริ่มมีการปรับเปลี่ยน Microsoft กำลังมุ่งหน้าสู่เส้นทางการพัฒนา AI แบบ "พึ่งพาตนเองได้อย่างแท้จริง"
จุดเริ่มต้นของการเปลี่ยนแปลงนี้สามารถย้อนกลับไปได้ถึงการเจรจาข้อตกลงความร่วมมือใหม่ระหว่างทั้งสองฝ่ายเมื่อปีที่แล้ว แม้ว่า Microsoft จะยังคงถือหุ้นใน OpenAI ประมาณ 27% และยังคงสามารถเข้าถึงโมเดลขั้นสูงได้ในระยะยาว แต่ภายในบริษัทก็ได้เริ่มสร้างกลยุทธ์แบบหลายโมเดลอย่างชัดเจนเพื่อ "ขจัดการพึ่งพาแหล่งที่มาเพียงแหล่งเดียว"
Mustafa Suleyman หัวหน้าฝ่าย AI ของ Microsoft ยอมรับในการให้สัมภาษณ์ว่า การพึ่งพาพันธมิตรเพียงรายเดียวมากเกินไปมีความเสี่ยงเชิงโครงสร้าง และการมีขีดความสามารถด้านการวิจัยและพัฒนาภายในองค์กรเป็นวิธีเดียวที่จะช่วยรับประกันความเป็นอิสระทางยุทธศาสตร์ในระยะยาว
จากการผงาดขึ้นอย่างรวดเร็วของคู่แข่งอย่าง Google, Meta และ Anthropic ในภาคส่วน AI ทำให้ Microsoft จำเป็นต้องเสริมความแข็งแกร่งให้กับปราการทางเทคโนโลยีของตนอย่างเร่งด่วน โดยเฉพาะอย่างยิ่ง โมเดลซีรีส์ Gemini ของ Google ได้ก้าวข้าม GPT-4o ของ OpenAI ในเกณฑ์มาตรฐานด้านประสิทธิภาพบางประการ ส่งผลให้ Microsoft ตระหนักว่าการพึ่งพาเทคโนโลยีภายนอกมากเกินไปอาจทำให้บริษัทเสียเปรียบในการแข่งขันด้าน AI ในอนาคต