Categories
NVIDIA Novice

OpenAI in NVIDIA: novi odprtokodni modeli gpt-oss-20B in gpt-oss-120B optimizirani za lokalno uporabo na RTX/RTX PRO

Vir: OpenAI’s New Models on RTX GPUs | NVIDIA Blog.

NVIDIA je optimizirala OpenAI-jeve nove odprtokodne modele gpt-oss-20b in gpt-oss-120b za svoje GPU-je, kar omogoča hitro izvajanje umetne inteligence od oblaka do osebnih računalnikov. Ti modeli podpirajo napredne agentne AI aplikacije, kot so spletno iskanje, globoke raziskave in več, z zmogljivostmi veriženega razmišljanja (chain-of-thought) ter prilagodljivimi stopnjami napora razmišljanja prek arhitekture mešanice strokovnjakov (mixture-of-experts). Modeli so bili usposobljeni na NVIDIA H100 GPU-jih in podpirajo kontekstne dolžine do 131.072, kar je primerno za naloge, kot so pomoč pri kodiranju in razumevanje dokumentov.

Na NVIDIA GeForce RTX 5090 GPU-ju lahko dosežejo zmogljivost do 256 žetonov na sekundo, z optimizacijami za RTX AI osebne računalnike in delovne postaje prek orodij, kot so Ollama, llama.cpp in Microsoft AI Foundry Local. To poudarja NVIDIA-jevo vodilno vlogo v AI-ju od usposabljanja do izvajanja in od oblaka do AI osebnih računalnikov, kar krepi tehnološko vodstvo ZDA v umetni inteligenci.

Več preberite na OpenAI’s New Models on RTX GPUs | NVIDIA Blog.

css.php