Qafas NVIDIA NeMo

Speċifikazzjonijiet
- Isem tal-Prodott: Qafas NVIDIA NeMo
- Pjattaformi Affettwati: Windows, Linux, macOS
- Verżjonijiet Affettwati: Il-verżjonijiet kollha qabel l-24
- Vulnerabbiltà tas-Sigurtà: CVE-2025-23360
- Punteġġ Bażi tal-Valutazzjoni tar-Riskju: 7.1 (CVSS v3.1)
Istruzzjonijiet għall-Użu tal-Prodott
Installazzjoni tal-Aġġornament tas-Sigurtà:
Biex tipproteġi s-sistema tiegħek, segwi dawn il-passi:
- Niżżel l-aħħar rilaxx mill-paġna NeMo-Framework-Launcher Releases fuq GitHub.
- Mur fuq is-Sigurtà tal-Prodott NVIDIA għal aktar informazzjoni.
Dettalji tal-Aġġornament tas-Sigurtà:
L-aġġornament tas-sigurtà jindirizza vulnerabbiltà fil-Qafas NVIDIA NeMo li jista 'jwassal għal eżekuzzjoni ta' kodiċi u data tampering.
Aġġornament tas-Softwer:
Jekk qed tuża rilaxx tal-fergħa preċedenti, huwa rakkomandat li taġġorna għall-aħħar rilaxx tal-fergħa biex tindirizza l-kwistjoni tas-sigurtà.
Fuqview
NVIDIA NeMo Framework huwa qafas AI ġenerattiv skalabbli u cloud-native mibni għal riċerkaturi u żviluppaturi li jaħdmu fuq Mudelli Kbar tal-Lingwa, Multimodali, u Diskors AI (eż Rikonoxximent Awtomatiku tad-Diskors u Test-to-Speech). Jippermetti lill-utenti joħolqu, jippersonalizzaw, u jużaw mudelli AI ġenerattivi ġodda billi jisfruttaw kodiċi eżistenti u punti ta 'kontroll tal-mudell imħarrġa minn qabel.
Setup Istruzzjonijiet: Installa NeMo Framework
Il-Qafas NeMo jipprovdi appoġġ minn tarf sa tarf għall-iżvilupp ta’ Mudelli ta’ Lingwi Kbar (LLMs) u Mudelli Multimodali (MMs). Jipprovdi l-flessibilità biex jintuża fuq il-post, f'ċentru tad-dejta, jew mal-fornitur tal-cloud preferut tiegħek. Jappoġġja wkoll l-eżekuzzjoni fuq ambjenti ppermettiet SLURM jew Kubernetes.

Kurazzjoni tad-Data
Kuratur NeMo [1] hija librerija Python li tinkludi sett ta 'moduli għall-estrazzjoni tad-data u l-ġenerazzjoni ta' data sintetika. Dawn huma skalabbli u ottimizzati għall-GPUs, li jagħmluhom ideali għall-kura tad-dejta tal-lingwa naturali biex jitħarrġu jew jiġu rfinati l-LLMs. B'NeMo Curator, tista 'tiġbed b'mod effiċjenti test ta' kwalità għolja minn materja prima estensiva web sorsi tad-dejta.
Taħriġ u Personalizzazzjoni
NeMo Qafas jipprovdi għodod għal taħriġ effiċjenti u l-adattament ta ' LLMs u Mudelli Multimodali. Jinkludi konfigurazzjonijiet awtomatiċi għall-konfigurazzjoni tal-cluster tal-kompjuters, it-tniżżil tad-dejta, u l-iperparametri tal-mudell, li jistgħu jiġu aġġustati biex jitħarrġu fuq settijiet ta 'dejta u mudelli ġodda. Minbarra t-taħriġ minn qabel, NeMo jappoġġa tekniki kemm ta 'Supervised Fine-Tuning (SFT) kif ukoll ta' Parameter Efficient Fine-Tuning (PEFT) bħal LoRA, Ptuning, u aktar.
Żewġ għażliet huma disponibbli biex tniedi t-taħriġ fin-NeMo - bl-użu tal-interface tal-API NeMo 2.0 jew b'NeMo Run.
- B'NeMo Run (Rakkomandat): NeMo Run jipprovdi interface biex tissimplifika l-konfigurazzjoni, l-eżekuzzjoni u l-ġestjoni ta 'esperimenti f'diversi ambjenti ta' komputazzjoni. Dan jinkludi t-tnedija ta' impjiegi fuq l-istazzjon tax-xogħol tiegħek lokalment jew fuq raggruppamenti kbar - kemm SLURM attivat kif ukoll Kubernetes f'ambjent cloud.
- Pre-taħriġ u PEFT Quickstart b'NeMo Run
- Bl-użu tal-API NeMo 2.0: Dan il-metodu jaħdem tajjeb b'setup sempliċi li jinvolvi mudelli żgħar, jew jekk inti interessat li tikteb id-dataloader tad-dwana tiegħek stess, il-loops tat-taħriġ, jew tibdel is-saffi tal-mudelli. Jagħtik aktar flessibilità u kontroll fuq il-konfigurazzjonijiet, u jagħmilha faċli li testendi u tippersonalizza l-konfigurazzjonijiet b'mod programmatiku.
-
Training Quickstart b'NeMo 2.0 API
-
Migrazzjoni minn NeMo 1.0 għal NeMo 2.0 API
-
Allinjament
- NeMo-Aligner [1] hija sett ta' għodda skalabbli għal allinjament effiċjenti tal-mudelli. Is-sett ta’ għodod għandu appoġġ għal algoritmi ta’ allinjament ta’ mudelli ta’ l-aktar avvanzata bħal SteerLM, DPO, Reinforcement Learning from Human Feedback (RLHF), u ħafna aktar. Dawn l-algoritmi jippermettu lill-utenti jallinjaw il-mudelli tal-lingwa biex ikunu aktar sikuri, li ma jagħmlux ħsara, u ta’ għajnuna.
- Il-punti ta 'kontroll NeMo-Aligner kollha huma kompatibbli ma' l-ekosistema NeMo, u jippermettu aktar adattament u skjerament ta 'inferenza.
Fluss tax-xogħol pass pass tat-tliet fażijiet kollha ta' RLHF fuq mudell żgħir GPT-2B:
- Taħriġ SFT
- Ippremja t-taħriġ tal-mudell
- Taħriġ PPO
Barra minn hekk, aħna nuru appoġġ għal diversi metodi ġodda ta' allinjament oħra:
- DPO: algoritmu ta 'allinjament ħafif meta mqabbel ma' RLHF b'funzjoni ta 'telf aktar sempliċi.
- Self-Play Irfinar (SPIN)
- SteerLM: teknika bbażata fuq kondizzjonata-SFT, b'output iggwidat.
Iċċekkja d-dokumentazzjoni għal aktar informazzjoni: Dokumentazzjoni ta' Allinjament
Mudelli Multimodali
- Il-Qafas NeMo jipprovdi softwer ottimizzat biex iħarreġ u juża mudelli multimodali tal-aktar avvanzati f'diversi kategoriji: Mudelli tal-Lingwa Multimodali, Fondazzjonijiet tal-Lingwa tal-Viżjoni, mudelli minn Test għal Immaġini, u lil hinn mill-Ġenerazzjoni 2D bl-użu ta' Oqsma ta' Radjanza Neurali (NeRF).
- Kull kategorija hija mfassla biex tilqa' għal ħtiġijiet u avvanzi speċifiċi fil-qasam, billi tuża mudelli avvanzati biex jimmaniġġjaw firxa wiesgħa ta 'tipi ta' dejta, inklużi test, stampi u mudelli 3D.
Nota
Qed nemigraw l-appoġġ għal mudelli multimodali minn NeMo 1.0 għal NeMo 2.0. Jekk trid tesplora dan id-dominju fil-frattemp, jekk jogħġbok irreferi għad-dokumentazzjoni għar-rilaxx NeMo 24.07 (preċedenti).
Skjerament u Inferenza
Il-Qafas NeMo jipprovdi diversi mogħdijiet għall-inferenza tal-LLM, li jaħseb għal xenarji ta’ skjerament u ħtiġijiet ta’ prestazzjoni differenti.
Uża b'NVIDIA NIM
- NeMo Framework jintegra bla xkiel ma' għodod ta' skjerament tal-mudelli fil-livell ta' intrapriża permezz ta' NVIDIA NIM. Din l-integrazzjoni hija mħaddma minn NVIDIA TensorRT-LLM, li tiżgura inferenza ottimizzata u skalabbli.
- Għal aktar informazzjoni dwar NIM, żur il-NVIDIA websit.
Skjerament b'TensorRT-LLM jew vLLM
- NeMo Framework joffri skripts u APIs biex jesporta mudelli għal żewġ libreriji ottimizzati għall-inferenza, TensorRT-LLM u vLLM, u biex juża l-mudell esportat bis-Server ta 'Inferenza NVIDIA Triton.
- Għal xenarji li jeħtieġu prestazzjoni ottimizzata, il-mudelli NeMo jistgħu jisfruttaw TensorRT-LLM, librerija speċjalizzata għall-aċċellerazzjoni u l-ottimizzazzjoni tal-inferenza LLM fuq GPUs NVIDIA. Dan il-proċess jinvolvi l-konverżjoni tal-mudelli NeMo f'format kompatibbli ma 'TensorRT-LLM bl-użu tal-modulu nemo.export.
- Skjerament LLM Overview
- Uża Mudelli Lingwi Kbar NeMo bl-NIM
- Uża Mudelli Lingwi Kbar NeMo b'TensorRT-LLM
- Uża Mudelli Lingwi Kbar NeMo b'vLLM
Mudelli Appoġġjati
Mudelli Kbar tal-Lingwa
| Mudelli Kbar tal-Lingwa | Taħriġ minn qabel u SFT | PEFT | Allinjament | FP8 Konverġenza tat-Taħriġ | TRT/TRTLLM | Ikkonverti Għal & Minn Wiċċ Hugging | Evalwazzjoni |
|---|---|---|---|---|---|---|---|
| Llama3 8B/70B, Llama3.1 405B | Iva | Iva | x | Iva (verifikata parzjalment) | Iva | It-tnejn | Iva |
| Mixtral 8x7B/8x22B | Iva | Iva | x | Iva (mhux verifikata) | Iva | It-tnejn | Iva |
| Nemotron 3 8B | Iva | x | x | Iva (mhux verifikata) | x | It-tnejn | Iva |
| Nemotron 4 340B | Iva | x | x | Iva (mhux verifikata) | x | It-tnejn | Iva |
| Baichuan2 7B | Iva | Iva | x | Iva (mhux verifikata) | x | It-tnejn | Iva |
| ChatGLM3 6B | Iva | Iva | x | Iva (mhux verifikata) | x | It-tnejn | Iva |
| Gemma 2B/7B | Iva | Iva | x | Iva (mhux verifikata) | Iva | It-tnejn | Iva |
| Gemma2 2B/9B/27B | Iva | Iva | x | Iva (mhux verifikata) | x | It-tnejn | Iva |
| Mamba2 130M/370M/780M/1.3B/2.7B/8B/ Hybrid-8B | Iva | Iva | x | Iva (mhux verifikata) | x | x | Iva |
| Phi3 mini 4k | x | Iva | x | Iva (mhux verifikata) | x | x | x |
| Qwen2 0.5B/1.5B/7B/72B | Iva | Iva | x | Iva (mhux verifikata) | Iva | It-tnejn | Iva |
| StarCoder 15B | Iva | Iva | x | Iva (mhux verifikata) | Iva | It-tnejn | Iva |
| StarCoder2 3B/7B/15B | Iva | Iva | x | Iva (mhux verifikata) | Iva | It-tnejn | Iva |
| BERT 110M/340M | Iva | Iva | x | Iva (mhux verifikata) | x | It-tnejn | x |
| T5 220M/3B/11B | Iva | Iva | x | x | x | x | x |
Mudelli tal-Lingwa tal-Viżjoni
| Mudelli tal-Lingwa tal-Viżjoni | Taħriġ minn qabel u SFT | PEFT | Allinjament | FP8 Konverġenza tat-Taħriġ | TRT/TRTLLM | Ikkonverti Għal & Minn Wiċċ Hugging | Evalwazzjoni |
|---|---|---|---|---|---|---|---|
| NeVA (LLaVA 1.5) | Iva | Iva | x | Iva (mhux verifikata) | x | Minn | x |
| Llama 3.2 Viżjoni 11B/90B | Iva | Iva | x | Iva (mhux verifikata) | x | Minn | x |
| LLaVA Next (LLaVA 1.6) | Iva | Iva | x | Iva (mhux verifikata) | x | Minn | x |
Inkorporazzjoni Mudelli
| Inkorporazzjoni Mudelli Lingwa | Taħriġ minn qabel u SFT | PEFT | Allinjament | FP8 Konverġenza tat-Taħriġ | TRT/TRTLLM | Ikkonverti Għal & Minn Wiċċ Hugging | Evalwazzjoni |
|---|---|---|---|---|---|---|---|
| SBERT 340M | Iva | x | x | Iva (mhux verifikata) | x | It-tnejn | x |
| Lama 3.2 Inkorporazzjoni 1B | Iva | x | x | Iva (mhux verifikata) | x | It-tnejn | x |
Mudelli tal-Fondazzjoni Dinjija
| Mudelli tal-Fondazzjoni Dinjija | Wara t-Taħriġ | Inferenza Aċċellerata |
|---|---|---|
| Cosmos-1.0-Diffusion-Text2World-7B | Iva | Iva |
| Cosmos-1.0-Diffusion-Text2World-14B | Iva | Iva |
| Cosmos-1.0-Diffusion-Video2World-7B | Dalwaqt | Dalwaqt |
| Cosmos-1.0-Diffusion-Video2World-14B | Dalwaqt | Dalwaqt |
| Cosmos-1.0-Autoregressive-4B | Iva | Iva |
| Cosmos-1.0-Autoregressive-Video2World-5B | Dalwaqt | Dalwaqt |
| Cosmos-1.0-Autoregressive-12B | Iva | Iva |
| Cosmos-1.0-Autoregressive-Video2World-13B | Dalwaqt | Dalwaqt |
Nota
NeMo jappoġġja wkoll it-taħriġ minn qabel kemm għall-arkitetturi tad-diffużjoni kif ukoll autoregressive text2world mudelli tal-pedament.
Diskors AI
L-iżvilupp ta' mudelli ta' AI konversazzjonali huwa proċess kumpless li jinvolvi d-definizzjoni, il-kostruzzjoni u t-taħriġ ta' mudelli f'oqsma partikolari. Dan il-proċess tipikament jeħtieġ diversi iterazzjonijiet biex jilħaq livell għoli ta 'eżattezza. Ħafna drabi tinvolvi iterazzjonijiet multipli biex tinkiseb preċiżjoni għolja, irfinar fuq kompiti varji u dejta speċifika għad-dominju, tiżgura l-prestazzjoni tat-taħriġ, u tħejji mudelli għall-iskjerament tal-inferenza.

Il-Qafas NeMo jipprovdi appoġġ għat-taħriġ u l-adattament tal-mudelli ta’ Speech AI. Dan jinkludi kompiti bħar-Rikonoxximent Awtomatiku tad-Diskors (ASR) u s-sinteżi Test-To-Speech (TTS). Joffri transizzjoni bla xkiel għall-iskjerament tal-produzzjoni fil-livell tal-intrapriża b'NVIDIA Riva. Biex jassisti lill-iżviluppaturi u r-riċerkaturi, il-Qafas NeMo jinkludi punti ta’ kontroll avvanzati mħarrġa minn qabel, għodod għall-ipproċessar tad-dejta tad-diskors riproduċibbli, u karatteristiċi għal esplorazzjoni u analiżi interattiva ta’ settijiet ta’ dejta tad-diskors. Il-komponenti tan-NeMo Framework for Speech AI huma kif ġej:
Taħriġ u Personalizzazzjoni
Il-Qafas NeMo fih dak kollu meħtieġ biex jitħarreġ u jippersonalizza l-mudelli tad-diskors (ASR, Klassifikazzjoni tad-Diskors, Rikonoxximent tal-Kelliem, Dijarizzazzjoni tal-Kelliem, u TTS) b'mod riproduċibbli.
SOTA Mudelli mħarrġa minn qabel
- Il-Qafas NeMo jipprovdi riċetti tal-aktar avvanzati u punti ta’ kontroll imħarrġa minn qabel ta’ diversi ASR u TTS mudelli, kif ukoll struzzjonijiet dwar kif jgħabbihom.
- Għodda tad-Diskors
- Il-Qafas NeMo jipprovdi sett ta’ għodod utli għall-iżvilupp ta’ mudelli ASR u TTS, inklużi:
- NeMo Forced Aligner (NFA) għall-ġenerazzjoni ta' timest fil-livell ta' token, kelma u segmentamps ta 'diskors fl-awdjo bl-użu ta' mudelli ta 'Rikonoxximent Awtomatiku tad-Diskors ibbażati fuq CTC ta' NeMo.
- Proċessur tad-Data tad-Diskors (SDP), sett ta' għodod għas-simplifikazzjoni tal-ipproċessar tad-dejta tad-diskors. Jippermettilek tirrappreżenta l-operazzjonijiet tal-ipproċessar tad-dejta f'konfigurazzjoni file, jimminimizza l-kodiċi boilerplate u jippermetti riproduċibbiltà u qsim.
- Speech Data Explorer (SDE), ibbażat fuq Dash web applikazzjoni għall-esplorazzjoni interattiva u analiżi ta 'settijiet ta' dejta tad-diskors.
- Għodda għall-ħolqien tas-sett tad-dejta li jipprovdi funzjonalità biex tallinja awdjo twil files bit-traskrizzjonijiet korrispondenti u aqsamhom fi frammenti iqsar li huma adattati għat-taħriġ tal-mudell tar-Rikonoxximent Awtomatiku tad-Diskors (ASR).
- Għodda ta' Tqabbil għall-Mudelli ASR biex iqabblu tbassir ta 'mudelli ASR differenti fil-preċiżjoni tal-kliem u l-livell tal-kelma.
- Evalwatur ASR għall-evalwazzjoni tal-prestazzjoni tal-mudelli ASR u karatteristiċi oħra bħal Voice Activity Detection.
- Għodda ta' Normalizzazzjoni tat-Test għall-konverżjoni tat-test mill-forma miktuba għall-forma mitkellma u viċi versa (eż. “31” vs “wieħed u tletin”).
- Mogħdija għall-Iskjerament
- Mudelli NeMo li ġew imħarrġa jew personalizzati bl-użu tal-Qafas NeMo jistgħu jiġu ottimizzati u skjerati b'NVIDIA Riva. Riva tipprovdi kontenituri u charts Helm iddisinjati speċifikament biex awtomatizzati l-passi għall-iskjerament tal-buttuna.
Riżorsi Oħra
- NeMo: Ir-repożitorju ewlieni għall-Qafas NeMo
- NeMo–Mexxi: Għodda biex tikkonfigura, tniedi u timmaniġġja l-esperimenti tiegħek tat-tagħlim bil-magni.
- NeMo-Aligner: Toolkit skalabbli għal allinjament effiċjenti tal-mudell
- NeMo-Kuratur: Kit ta' għodod għall-ipproċessar minn qabel u l-kura tad-dejta skalabbli għal LLMs
Involvi ruħek mal-komunità NeMo, staqsi mistoqsijiet, ikseb appoġġ, jew irrapporta bugs.
- Diskussjonijiet NeMo
- Kwistjonijiet NeMo
Lingwi u Oqfsa ta' Programmazzjoni
- Python: L-interface ewlenija biex tuża NeMo Framework
- Pytorch: NeMo Framework huwa mibni fuq PyTorch
Liċenzji
- NeMo Github repo huwa liċenzjat taħt il-liċenzja Apache 2.0
- Il-Qafas NeMo huwa liċenzjat taħt il-FTEHIM TAL-PRODOTT NVIDIA AI. Billi tiġbed u tuża l-kontenitur, taċċetta t-termini u l-kundizzjonijiet ta 'din il-liċenzja.
- Il-kontenitur tal-Qafas NeMo fih materjali Llama rregolati mill-Ftehim tal-Liċenzja Komunitarja Meta Llama3.
Noti f'qiegħ il-paġna
Bħalissa, l-appoġġ ta 'NeMo Curator u NeMo Aligner għal mudelli Multimodali huwa xogħol li qed isir u se jkun disponibbli dalwaqt.
FAQ
Q: Kif nista' niċċekkja jekk is-sistema tiegħi hijiex affettwata mill-vulnerabbiltà?
A: Tista 'tiċċekkja jekk is-sistema tiegħek hijiex affettwata billi tivverifika l-verżjoni tal-Qafas NVIDIA NeMo installat. Jekk tkun taħt il-verżjoni 24, is-sistema tiegħek tista' tkun vulnerabbli.
Q: Min irrapporta l-kwistjoni tas-sigurtà CVE-2025-23360?
A: Il-kwistjoni tas-sigurtà ġiet irrappurtata minn Or Peles – JFrog Security. NVIDIA tirrikonoxxi l-kontribut tagħhom.
Q: Kif nista' nirċievi notifiki futuri tal-bullettin tas-sigurtà?
A: Żur il-paġna tas-Sigurtà tal-Prodott NVIDIA biex tabbona għan-notifiki tal-bullettin tas-sigurtà u tibqa’ infurmata dwar l-aġġornamenti tas-sigurtà tal-prodott.
Dokumenti / Riżorsi
![]() |
Qafas NVIDIA NeMo [pdfGwida għall-Utent Qafas NeMo, NeMo, Qafas |

