IBM amplia la famiglia di modelli Granite con una nuova AI multi-modello e con capacità di reasoning progettata per l’impresa

Effettua la tua ricerca

More results...

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
Filter by Categories
#finsubito

Microcredito

per le aziende

 


Finanziamenti personali e aziendali

Prestiti immediati

 

Granite 3.2 – piccoli modelli di intelligenza artificiale che offrono capacità di reasoning, visive e di protezione, con una licenza pensata per gli sviluppatori

IBM ha annunciato Granite 3.2, la nuova generazione della sua famiglia di modelli linguistici di grandi dimensioni (LLM) Granite, con il costante obiettivo di fornire un’AI aziendale che sia compatta, efficiente e pratica per determinare un impatto concreto.

Tutti i modelli Granite 3.2 sono disponibili con la licenza permissiva Apache 2.0 su Hugging Face. Oggi su IBM watsonx.ai, Ollama, Replicate e LM Studio, e a breve su RHEL AI 1.5, sono disponibili modelli specifici che introducono funzionalità avanzate per le aziende e per la comunità open-source. I punti salienti includono:

  • Un nuovo vision language model (VLM) per attività di comprensione di documenti, che registra prestazioni pari o superiori a quelle di modelli significativamente più grandi, Llama 3.2 11B e Pixtral 12B, sui benchmark aziendali essenziali DocVQA, ChartQA, AI2D e OCRBench. Oltre a dati di addestramento robusti, IBM ha utilizzato il proprio toolkit open-source Docling per elaborare 85 milioni di PDF e ha generato 26 milioni di coppie domanda-risposta sintetiche per migliorare la capacità del VLM di gestire flussi di lavoro complessi con molti documenti.
  • Capacità di chain of thought per un ragionamento potenziato nei modelli 3.2 2B e 8B, con la possibilità di attivare o disattivare il ragionamento per ottimizzare l’efficienza. Con questa capacità, il modello 8B ottiene miglioramenti con valori a due cifre rispetto al suo predecessore nei benchmark di follow-up delle istruzioni come ArenaHard e Alpaca Eval, senza degradare in alcun modo la sicurezza o le prestazioni. Inoltre, con l’uso di nuovi metodi di scalabilità dell’inferenza, il modello Granite 3.2 8B può essere calibrato per competere con le prestazioni di modelli molto più grandi come Claude3.5-Sonnet o GPT-4o nei benchmark di ragionamento matematico come AIME2024 e MATH500.
  • Opzioni di dimensioni ridotte per i modelli di sicurezza Granite Guardian, che mantengono le prestazioni dei precedenti modelli Granite 3.1 Guardian con una riduzione del 30% delle dimensioni. I modelli 3.2 introducono anche una nuova funzionalità definita “verbalized confidence” (fiducia verbalizzata), che offre una valutazione del rischio più sfumata che riconosce l’ambiguità nel monitoraggio della sicurezza.

La strategia di IBM di fornire modelli AI specializzati e di dimensioni ridotte per le aziende continua a dimostrare efficacia nei test, con il modello Granite 3.1 8B che ha recentemente ottenuto punteggi elevati in termini di accuratezza nel Salesforce LLM Benchmark per CRM.

Prestito personale

Delibera veloce

 

La famiglia di modelli Granite è supportata da un solido ecosistema di partner, tra cui aziende leader nel software che incorporano i modelli Granite nelle loro tecnologie.

“In CrushBank, abbiamo visto in prima persona come i modelli AI aperti ed efficienti di IBM offrano un valore reale per l’AI aziendale, fornendo il giusto equilibrio tra prestazioni, efficacia dei costi e scalabilità”, ha affermato David Tan, CTO di CrushBank. “Granite 3.2 fa un ulteriore passo avanti con nuove capacità di ragionamento e siamo entusiasti di esplorarle nella creazione di nuove soluzioni agentiche”.

Granite 3.2 rappresenta un passo importante nell’evoluzione del portfolio e della strategia di IBM per fornire un’AI pratica e di piccole dimensioni per le aziende. Sebbene gli approcci a “chain of thought” per il ragionamento siano potenti, richiedono una notevole potenza di calcolo che non è necessaria per ogni attività. Pertanto, IBM ha introdotto la possibilità di attivare o disattivare programmaticamente la catena di pensieri. Per attività più semplici, il modello funziona senza ragionamento per ridurre il sovraccarico di calcolo non necessario. Inoltre, altre tecniche di ragionamento come la scalabilità dell’inferenza hanno dimostrato che il modello Granite 8B può eguagliare o superare le prestazioni di modelli molto più grandi nei benchmark standard di ragionamento matematico. I metodi in evoluzione come la scalabilità dell’inferenza rimangono un’area chiave di interesse per i team di ricerca di IBM.

Insieme ai modelli Granite 3.2 Instruct, Vision e Guardrail, IBM sta rilasciando la prossima generazione dei suoi modelli TinyTimeMixers (TTM) (meno di 10 milioni di parametri), con capacità di previsione a lungo termine fino a due anni nel futuro. Questi costituiscono strumenti potenti per l’analisi delle tendenze a lungo termine, comprese le tendenze finanziarie ed economiche, la previsione della domanda della supply chain e la pianificazione dell’inventario stagionale nel settore della vendita al dettaglio.

“La prossima era dell’AI riguarda l’efficienza, l’integrazione e l’impatto nel mondo reale, dove le aziende possono ottenere risultati potenti senza spese eccessive di elaborazione”, ha affermato Sriram Raghavan, VP di IBM AI Research. “Gli ultimi sviluppi di IBM Granite si concentrano su soluzioni open e rappresentano un ulteriore passo avanti nel rendere l’AI più accessibile, conveniente e di valore per le aziende moderne”.

Carta di credito con fido

Procedura celere

 





Source link

***** l’articolo pubblicato è ritenuto affidabile e di qualità*****

Visita il sito e gli articoli pubblicati cliccando sul seguente link

Source link