Udeležite se konference NVIDIA GTC 2025, vodilnega svetovnega dogodka na področju umetne inteligence, visokozmogljivega računalništva in inovacij. Odkrijte najnovejše tehnologije, povežite se z industrijskimi strokovnjaki in spoznajte, kako napredna AI rešuje največje izzive sodobnega sveta.
📅 Datum: 17.–21. marec 2025 📍 Lokacija: San Jose, Kalifornija & spletno predvajanje
Ne zamudite ekskluzivnih predstavitev, delavnic in priložnosti za mreženje z vodilnimi AI strokovnjaki. Registrirajte se zdaj in soustvarjajte prihodnost AI!
Da bi razvijalcem omogočili varno eksperimentiranje z zmogljivostmi DeepSeek-R1 in gradnjo lastnih specializiranih agentov, je model DeepSeek-R1 s 671 milijardami parametrov zdaj na voljo kot predogled mikroservisa NVIDIA NIM na build.nvidia.com. Mikrostoritev DeepSeek-R1 NIM lahko zagotovi do 3.872 tokenov na sekundo na enem sistemu NVIDIA HGX H200.
Razvijalci lahko preizkusijo in eksperimentirajo z vmesnikom za programiranje aplikacij (API), ki bo kmalu na voljo kot prenosljiv mikroservis NIM, del programske platforme NVIDIA AI Enterprise.
Mikrostoritev DeepSeek-R1 NIM poenostavlja uvajanje s podporo za industrijsko standardizirane API-je. Podjetja lahko povečajo varnost in zasebnost podatkov z izvajanjem mikrostoritve NIM na svoji izbrani pospešeni računalniški infrastrukturi. Z uporabo NVIDIA AI Foundry in programske opreme NVIDIA NeMo bodo podjetja prav tako lahko ustvarila prilagojene DeepSeek-R1 NIM mikrostoritve za specializirane AI agente.
NVIDIA v svojem širokem naboru programske opreme ponuja tudi NIM (NVIDIA Inference Microservices) in NVIDIA Blueprints, ki poenostavljajo uvedbo generativne umetne inteligence v različnih panogah. NVIDIA NIM™ omogoča optimizirane, oblačne mikrostoritve za sklepanje na osnovi AI, medtem ko NVIDIA Blueprintsponujajo vnaprej pripravljene delovne tokove za hitrejši razvoj in implementacijo.
Te rešitve podjetjem omogočajo hitrejšo uvedbo AI, zmanjšanje kompleksnosti infrastrukture in večjo produktivnost. Ne glede na to, ali gre za oblak, lokalne strežnike ali hibridna okolja, NVIDIA-jeva nova AI orodja prinašajo prilagodljivost in razširljivost.
Na sejmu CES 2025 je NVIDIA predstavila Project DIGITS, osebni AI superračunalnik, zasnovan za zagotavljanje namiznega dostopa do platforme NVIDIA Grace Blackwell raziskovalcem umetne inteligence, podatkovnim znanstvenikom in študentom. Osrednji del sistema je novi NVIDIA GB10 Grace Blackwell Superchip, ki zagotavlja do 1 petaflop AI zmogljivosti pri natančnosti FP4. GB10 združuje NVIDIA Blackwell GPU z najnovejšimi CUDA® jedri in peto generacijo Tensor Cores, povezanimi prek NVLink®-C2C z visokozmogljivim NVIDIA Grace™ CPU, ki vsebuje 20 jeder na osnovi Arm arhitekture. Razvit v sodelovanju z MediaTek, GB10 poudarja energetsko učinkovitost in zmogljivost. Vsaka enota Project DIGITS vključuje 128 GB enotnega pomnilnika in do 4 TB NVMe shrambe, kar omogoča obdelavo AI modelov z do 200 milijardami parametrov. Za večje modele je mogoče povezati dve enoti, da podpirata do 405 milijard parametrov. Ta konfiguracija omogoča uporabnikom razvoj in izvajanje inferenc modelov lokalno ter njihovo brezhibno
Na blogu podjetja NVIDIA so izpostavili, kako ključna je kapaciteta pomnilnika grafičnih procesorjev (GPU) za uspešno izvajanje naprednih modelov umetne inteligence (UI). Uporaba velikih UI modelov, kot je na primer Llama 2 s 7 milijardami parametrov, zahteva velike količine pomnilnika. Na primer, za obdelavo v natančnosti FP16 je potrebno najmanj 28 GB pomnilnika.
NVIDIA ponuja visokozmogljive RTX GPU-je, kot je model RTX 6000 Ada Generation, ki vključuje do 48 GB VRAM-a. Ti GPU-ji so zasnovani za delo z največjimi modeli umetne inteligence, kar omogoča lokalni razvoj in izvajanje zahtevnih nalog. Poleg tega so opremljeni s posebno strojno opremo, kot so Tensor Cores, ki znatno pospešijo izračune, potrebne za umetno inteligenco.
Z zmogljivimi rešitvami NVIDIA lahko podjetja in raziskovalci optimizirajo razvoj in implementacijo modelov UI neposredno na lokalnih napravah, kar odpira številne nove možnosti za napredek v umetni inteligenci.
Če želite izvedeti več o zmogljivih NVIDIA rešitvah, se obrnite na nas v Xenya d.o.o., kjer vam z veseljem pomagamo najti pravo rešitev za vaše potrebe!
Podjetij WEKA in NVIDIA sodelujeta pri integraciji zmogljivih NVIDIA BlueField DPU procesnih enot s platformo za shranjevanje podatkov WEKA, kar omogoča bolj učinkovito obdelavo AI nalog. Integracija prinaša izboljšave na področjih prenosa podatkov, zmanjševanja zamud in varnosti, saj WEKA klient teče neposredno na NVIDIA BlueField DPU, namesto na CPU gostiteljskega strežnika. Ta pristop ne samo da izboljša zmogljivost, ampak tudi zmanjšuje obremenitev CPU in povečuje varnost sistema s prenosom operacij shranjevanja na DPU.
Predstavitev in diskusija o teh integracijah sta bili izpostavljeni na konferenci Supercomputing 2024, kjer so udeleženci lahko v živo videli, kako izboljšane hitrosti dostopa do podatkov in učinkovitejše obdelave obremenitev pomagajo transformirati operacije v podatkovnih centrih. Za več informacij si oglejte celoten članek na NVIDIA Technical Blogu Integration of NVIDIA BlueField DPUs with WEKA Client Boosts AI Workload Efficiency | NVIDIA Technical Blog.
Gradnja multimodalnega sistema z uporabo arhitekture RAG predstavlja velik izziv. Težave izhajajo iz zajemanja in indeksiranja informacij iz različnih modalitet, vključno z besedilom, slikami, tabelami, avdio in video ter drugimi. Avtorji so v prejšnji objavi, “Enostaven uvod v multimodalni Retrieval-Augmented Generation“, razpravljali o tem, kako se spopasti z besedilom in slikami. Ta objava razširja razpravo na avdio in video. Posebej raziskujejo, kako zgraditi multimodalni RAG sistem za iskanje informacij v videoposnetkih.
Hitri razvoj rešitev z uporabo tehnologije obogatenega generiranja z iskanjem (RAG) za delovne tokove vprašanj in odgovorov z LLM je privedel do novih vrst sistemskih arhitektur. Delo v podjetju NVIDIA z uporabo umetne inteligence za notranje operacije je privedlo do več pomembnih ugotovitev za usklajevanje zmogljivosti sistemov z uporabniškimi pričakovanji.
Ugotovili so, da uporabniki, ne glede na predvideni obseg ali primer uporabe, na splošno želijo biti sposobni izvajati naloge, ki niso povezane z RAG, kot so prevajanje dokumentov, urejanje e-pošte ali celo pisanje kode. Aplikacija RAG brez dodatkov bi lahko bila izvedena tako, da izvaja iskalni proces pri vsakem sporočilu, kar vodi do prekomerne uporabe žetonov in neželene latence, saj so vključeni nepomembni rezultati.
V petek 6. decembra se je v Gospodarski zbornici Slovenije odvijal že 20. tradicionalni posvet Avtomatizacija strege in montaže – ASM ’24.
Gre za edini specializirani strokovni posvet, ki se je v organizaciji Fakultete za strojništvo, Univerze v Ljubljani odvijal in vzpodbudil veliko zanimanja podjetij za prihodnost proizvodnih procesov. Dogodek je mesto za srečevanja in posvetovanja, kjer lahko aktivno izmenjajo mnenja strokovnjaki iz področja avtomatizacij in industrije.
Inovacije in konkurenčnost, ter povezovanje, vodi v napredek gospodarstva in nas tako lahko postavi v ospredje na globalni ravni. Napredna umetna inteligenca je nepogrešljiva, tako pri planiranju, izvajanju, servisiranju ali seljenju proizvodnih procesov, saj lahko z njeno pomočjo hitreje načrtujemo optimalno izvedbo vseh aktivnosti.
XENYA d.o.o. je letos predstavila platformo NVIDIA Omniverse™, saj kot NVIDIA elitni partner želimo ponuditi slovenskemu gospodarstvu najboljšo rešitev za kreiranje, planiranje, vizualizacijo in vzpostavitev novih proizvodnih procesov.
NVIDIA Omniverse™ je odprta platforma za sodelovanje in simulacijo v virtualnem 3D okolju, ki temelji na odprtokodnem zapisu Open USD. Omniverse omogoča uporabnikom ustvarjanje, razvoj in upravljanje kompleksnih 3D virtualnih svetov v realnem času, kar omogoča vsem hkratno spreminjanje in vpogled v skupni virtualni svet. Poleg tega lahko izvaja tudi kompleksne dodatne funkcije, kot je zagotavljanje, da objekti v tem 3D svetu spoštujejo fizikalne zakone, ki veljajo v resničnem svetu. Platforma je zasnovana za oblikovalce, inženirje in razvijalce, da lahko skupaj razvijajo projekte, kot so 3D modeli, animacije, simulacije in digitalne dvojčke in pri tem uporabljajo tudi vrsto najbolj znanih programskih orodij tretjih proizvajalcev na svojem področju. Ker lahko testi v virtualnem svetu prihranijo veliko časa in stroškov, je Omniverse še posebej uporaben v industrijah, kjer je potrebna visoka stopnja realizma in natančna simulacija realnega sveta, kot so arhitektura, inženiring, avtomobilska industrija in druga kompleksna industrijska proizvodnja ter filmska industrija.
Podjetja, kot so Coca-Cola, Amazon, BMW, Wistron in mnoga druga že digitalizirajo svoje procese z NVIDIA Omniverse™. Več si poglejte na:
Agentična umetna inteligenca uporablja prefinjeno sklepanje in ponavljajoče se načrtovanje za avtonomno reševanje zapletenih, večstopenjskih problemov.
Klepetalni roboti UI uporabljajo generativno umetno inteligenco za zagotavljanje odzivov na podlagi ene same interakcije. Oseba poda poizvedbo, klepetalni robot pa odgovori z obdelavo naravnega jezika.
Naslednja meja umetne inteligence je agentična umetna inteligenca, ki uporablja prefinjeno sklepanje in iterativno načrtovanje za avtonomno reševanje kompleksnih, večstopenjskih problemov. To bo povečalo produktivnost in delovanje v različnih panogah.
Agentični sistemi umetne inteligence sprejemajo velike količine podatkov iz različnih virov, da bi samostojno analizirali izzive, razvijali strategije in izvajali naloge, kot so optimizacija dobavne verige, analiza ranljivosti na področju kibernetske varnosti in pomoč zdravnikom pri dolgotrajnih opravilih.