Nvidia's new Blackwell chips trained Meta's large Llama 3.1 model in just 27 minutes

แหล่งที่มา Cryptopolitan

Nvidia’s new Blackwell chips are changing how quickly artificial intelligence systems can be trained.

In the latest round of benchmarking results released on Wednesday by MLCommons, a nonprofit group that tracks and compares the capabilities of AI chips, the Blackwell architecture programmed by Nvidia set records.

When tested with Meta’s open-source Llama 3.1 405B model, one of its biggest and most complex AI models, training was finished in only 27 minutes using Blackwell chips. This was done with only 2,496 Blackwell GPUs, an order of magnitude less than what it would have taken with Nvidia’s previous Hopper chips.

In contrast, previous designs used over three times as many Hopper GPUs to deliver equivalent performance. By the chip, Blackwell was more than twice as speedy, which was a huge jump in convergence efficiency. That kind of performance boost could translate into major time and cost savings for organizations training trillion-parameter models.

These results are believed to be the first MLCommons benchmarks for training models at these extreme scales and provide a real-world measurement of how well chips handle the most demanding AI workloads.

CoreWeave, Nvidia drive smarter AI scaling

Not only were the results a victory for Nvidia, but they also highlighted the work of CoreWeave, a cloud infrastructure company that partnered on the tests. In a press conference, CoreWeave Chief Product Officer Chetan Kapoor pointed out a general direction that increasingly made sense in the industry: away from large, homogeneous blocks of tens of thousands of GPUs.

Rather than building a single, massive, monolithic computing system, companies are now looking at smaller, interconnected subsets that can manage massive model training more efficiently and with better scaling.

Kapoor said that with such a technique, developers can continue scaling up or cutting down the time required to train extremely large models with trillions of parameters.

The move to the modular deployment of hardware is also necessary as the size and complexity of AI models only inflate.

Blackwell puts Nvidia in the lead for AI model training

Though the focus lately has shifted to AI inference, in which models like ChatGPT1 answer user questions in real-time, training is still the workhorse of AI development.

The training part gives these models their smarts, allowing them to understand language, tackle some of our most challenging problems, and even produce human-like prose. The computation is highly demanding and requires thousands of high-performance chips to operate for long periods, typically days, if not weeks or months.

That has changed with Nvidia’s Blackwell architecture. By radically cutting the chips and time it takes to train gargantuan AI models, Blackwell chips give Nvidia a better hand in a market where speed and efficiency rule the roost. 

Training models such as Meta’s Llama 3.1 405B, which has trillions of parameters, have previously had to be run on huge clusters of GPUs and have been an expensive energy-guzzling process. 

Such performance gains are a significant leg up at a time when there is blistering demand for ever larger and more powerful AI models across many industries — from health care and finance to education and autonomous vehicles.

It also sends a clear message to Nvidia’s rivals. Now, chip companies like AMD and Intel, which are working on their AI-specific chips, are under greater pressure to maintain a similar pace.

AMD submitted to the MLCommons benchmark test but didn’t show results for a model as large as Llamas 3.1 405B. Nvidia was the only one that tested at the high end of the benchmark, proving that it was the superior hardware and willing to take on the hardest challenges.

Cryptopolitan Academy: Want to grow your money in 2025? Learn how to do it with DeFi in our upcoming webclass. Save Your Spot

ข้อจำกัดความรับผิดชอบ: เพื่อการอ้างอิงเท่านั้น ผลการดำเนินงานในอดีตไม่ได้บ่งบอกถึงผลลัพธ์ในอนาคต
placeholder
การคาดการณ์ราคา GBP/JPY: ดูเหมือนว่าจะพร้อมที่จะสร้างโมเมนตัมต่อไปเหนือระดับ 195.00คู่สกุลเงิน GBP/JPY ปรับตัวขึ้นต่อจากการรีบาวด์ที่ดีในวันก่อนหน้าจากบริเวณ 192.75-192.70 หรือจุดต่ำสุดในรอบกว่าหนึ่งสัปดาห์ และได้รับแรงผลักดันเชิงบวกเป็นวันที่สองติดต่อกันในวันพุธ
ผู้เขียน  FXStreet
6 เดือน 04 วัน พุธ
คู่สกุลเงิน GBP/JPY ปรับตัวขึ้นต่อจากการรีบาวด์ที่ดีในวันก่อนหน้าจากบริเวณ 192.75-192.70 หรือจุดต่ำสุดในรอบกว่าหนึ่งสัปดาห์ และได้รับแรงผลักดันเชิงบวกเป็นวันที่สองติดต่อกันในวันพุธ
placeholder
การคาดการณ์ราคา AUDJPY: อคติขาขึ้นของผู้ค้าปลีก แม้จะมีการถอยกลับจากระดับสูงสุดใน 4 วันAUD/JPY ปรับตัวลดลง 0.20% ในช่วงปลายตลาดลงทุนอเมริกาเหนือวันพุธ หลังจากที่เคยทำกำไรได้ในช่วงก่อนหน้านี้ เนื่องจากตลาดหุ้นสหรัฐฯ ปิดผสมผสานกันจากข้อมูลเศรษฐกิจสหรัฐฯ ที่ออกมาแย่กว่าที่คาดการณ์ ในขณะที่เขียนข่าวนี้ คู่เงินเคลื่อนไหวอยู่ที่ 92.73 หลังจากเคยแตะระดับสูงสุดในรอบ 4 วันที่ 93.58
ผู้เขียน  FXStreet
เมื่อวาน 01: 53
AUD/JPY ปรับตัวลดลง 0.20% ในช่วงปลายตลาดลงทุนอเมริกาเหนือวันพุธ หลังจากที่เคยทำกำไรได้ในช่วงก่อนหน้านี้ เนื่องจากตลาดหุ้นสหรัฐฯ ปิดผสมผสานกันจากข้อมูลเศรษฐกิจสหรัฐฯ ที่ออกมาแย่กว่าที่คาดการณ์ ในขณะที่เขียนข่าวนี้ คู่เงินเคลื่อนไหวอยู่ที่ 92.73 หลังจากเคยแตะระดับสูงสุดในรอบ 4 วันที่ 93.58
placeholder
ราคาทองคำยังคงดิ้นรนเพื่อดึงดูดผู้ซื้อ; ยังคงต่ำกว่าระดับสูงสุดในหลายสัปดาห์ที่แตะเมื่อวันอังคารราคาทองคำ (XAU/USD) ขยับลงหลังจากการปรับตัวขึ้นในเซสชั่นเอเชียไปที่บริเวณ $3,384 ท่ามกลางการดีดตัวขึ้นเล็กน้อยของดอลลาร์สหรัฐ (USD) แม้ว่าทิศทางในระยะสั้นดูเหมือนจะเอียงไปในทางที่สนับสนุนเทรดเดอร์ขาขึ้น
ผู้เขียน  FXStreet
เมื่อวาน 06: 12
ราคาทองคำ (XAU/USD) ขยับลงหลังจากการปรับตัวขึ้นในเซสชั่นเอเชียไปที่บริเวณ $3,384 ท่ามกลางการดีดตัวขึ้นเล็กน้อยของดอลลาร์สหรัฐ (USD) แม้ว่าทิศทางในระยะสั้นดูเหมือนจะเอียงไปในทางที่สนับสนุนเทรดเดอร์ขาขึ้น
placeholder
USD/JPY ฟื้นตัวจากความตึงเครียดทางการค้าระหว่างสหรัฐฯ และจีนที่ลดลง ก่อนรายงาน NFP ที่สำคัญเงินเยนญี่ปุ่น (JPY) กำลังอ่อนค่าลงเมื่อเทียบกับดอลลาร์สหรัฐ (USD) ในวันพฤหัสบดี หลังจากมีข่าวเกี่ยวกับการโทรศัพท์ที่มีประสิทธิผลระหว่างประธานาธิบดีสหรัฐโดนัลด์ ทรัมป์ และประธานาธิบดีจีนสี จิ้นผิง
ผู้เขียน  FXStreet
12 ชั่วโมงที่แล้ว
เงินเยนญี่ปุ่น (JPY) กำลังอ่อนค่าลงเมื่อเทียบกับดอลลาร์สหรัฐ (USD) ในวันพฤหัสบดี หลังจากมีข่าวเกี่ยวกับการโทรศัพท์ที่มีประสิทธิผลระหว่างประธานาธิบดีสหรัฐโดนัลด์ ทรัมป์ และประธานาธิบดีจีนสี จิ้นผิง
placeholder
ราคาทองคำเคลื่อนไหวด้วยแนวโน้มเชิงบวกต่ำกว่า $3,400 โดยมีจุดสูงสุดหลายสัปดาห์รอการประกาศ NFP ของสหรัฐฯราคาทองคํา (XAU/USD) ดึงดูดแรงช้อนซื้อได้ในช่วงเซสชั่นเอเชียของวันศุกร์ และกลับตัวขึ้นบางส่วนจากการปรับตัวลดลงในวันก่อนหน้าจากระดับที่สูงกว่า $3,400 หรือระดับสูงสุดในรอบ 4 สัปดาห์
ผู้เขียน  FXStreet
7 ชั่วโมงที่แล้ว
ราคาทองคํา (XAU/USD) ดึงดูดแรงช้อนซื้อได้ในช่วงเซสชั่นเอเชียของวันศุกร์ และกลับตัวขึ้นบางส่วนจากการปรับตัวลดลงในวันก่อนหน้าจากระดับที่สูงกว่า $3,400 หรือระดับสูงสุดในรอบ 4 สัปดาห์
goTop
quote