Fujitsu ottimizza il riconoscimento video basato sull'intelligenza artificiale con una tecnologia di compressione di alta qualità
I dati video ad altissimo volume e ad altissima definizione vengono compressi a 1/10 delle dimensioni dei dati della tecnologia di compressione convenzionale, per un'analisi ottimizzata nel cloud, utilizzando una nuova tecnica.
Fujitsu Laboratories ha sviluppato una tecnologia per Comprimi dati video ad alta definizione e grandi volumi fino alle dimensioni minime richieste, per applicazioni di riconoscimento video intelligenza artificiale (AI). Questa tecnologia è in grado di comprimere i dati video fino a raggiungere solo un decimo delle dimensioni dei dati preparati con la tecnologia di compressione convenzionale, destinata alla conferma visiva da parte degli esseri umani.
Negli ultimi anni, c'è stato un forte aumento della domanda di analisi AI dei dati video in varie aree aziendali. Si prevede che l'espansione del sistema di comunicazione mobile 5G, in particolare, contribuirà a un aumento esplosivo del numero di immagini video ad altissima definizione catturate dalle telecamere, nonché di molte immagini scattate per strada e sulle linee di produzione.
Nello sviluppo di questa nuova tecnologia di compressione, Fujitsu si è concentrata su una grande divergenza nel modo in cui l'intelligenza artificiale e gli esseri umani riconoscono le immagini. Cioè, l'intelligenza artificiale e gli esseri umani tendono a differire nelle aree dell'immagine che vengono enfatizzate come importanti, quando si tratta di riconoscere persone, animali o oggetti nei dati video.
Per questo motivo, l'azienda ha sviluppato una tecnologia per analizza automaticamente le aree sotto i valori AI e comprimere i dati alla dimensione minima che può riconoscere. Ciò consente di analizzare una grande quantità di dati video senza compromettere la precisione del riconoscimento, riducendo al contempo in modo significativo i costi operativi e di trasmissione dei dati. Si prevede inoltre che la tecnologia consentirà agli utenti di analizzare le informazioni video in modo più avanzato, combinando più dati video memorizzati nel cloud, dati sui sensori e sulle prestazioni, come le vendite.
Contesto e sfide
Negli ultimi anni, la tecnologia per analizzare le immagini utilizzando l'intelligenza artificiale si è sviluppata rapidamente e si prevede che sarà una delle forze trainanti della trasformazione digitale in molte aziende di diversi settori. Con l'avvento di sofisticati servizi mobili 5G nel 2020, la domanda di analisi dell'intelligenza artificiale aumenterà ulteriormente, accompagnata dal crescente uso di telecamere Ultra alta definizione 4K e 8K e grandi quantità di dati video per applicazioni che includono l'analisi comportamentale nei settori manifatturiero e della vendita al dettaglio.
Ciononostante, le esigenze di elaborazione delle tecniche di deep learning utilizzate per l'analisi delle immagini presentano sfide considerevoli. Una tecnica efficace per garantire la potenza tecnologica necessaria per far fronte a queste attività è l'elaborazione in combinazione con il cloud, ma poiché i dati video sono spesso dispendiosi in termini di risorse, è necessaria una tecnologia ad alta compressione in grado di trasmettere tutti i dati video al cloud senza compromettere la qualità, in modo che la larghezza di banda della rete non venga sovraccaricata.
La tecnologia
La compressione video riduce la qualità dell'immagine a seconda del tasso di compressione e, se l'area su cui si concentra l'IA è eccessivamente compressa, la precisione del riconoscimento diminuisce. Fujitsu ha sviluppato una tecnologia di compressione video che analizza automaticamente l'area di un oggetto riconosciuto dall'intelligenza artificiale come materiale di analisi in un'immagine di 1 fotogramma di dati video, comprimendo l'immagine con la qualità minima richiesta per il riconoscimento di ciascuna area. Applicando questa tecnologia, le dimensioni dei dati video possono essere notevolmente ridotte rispetto alle tecnologie di compressione convenzionali, mantenendo al contempo l'accuratezza del riconoscimento
La tecnologia per stimare automaticamente il rapporto di compressione senza influire sull'accuratezza del riconoscimento AI
Per ciascuna area viene analizzato l'effetto della degradazione della qualità dell'immagine specifica della compressione sull'accuratezza del riconoscimento. Il rapporto di compressione che non influisce sull'accuratezza del riconoscimento viene stimato automaticamente in base ai risultati del riconoscimento AI. Il grado di importanza delle caratteristiche nel processo di riconoscimento da parte dell'IA viene determinato per tutte le aree, sommando gli effetti sui risultati del riconoscimento, quando vengono modificati il rapporto di compressione dell'intera immagine e anche la qualità dell'immagine. Il tasso di compressione immediatamente prima che l'accuratezza del riconoscimento si deteriori rapidamente in ciascuna area, è stimato come un tasso di compressione che non influisce sull'accuratezza del riconoscimento.
Inoltre, restituisce i risultati dell'intelligenza artificiale dalle immagini successive per aumentare la compressione al massimo che l'intelligenza artificiale può riconoscere. In tal modo, la tecnologia raggiunge un'elevata compressione delle immagini, pur mantenendo l'accuratezza del riconoscimento AI.
Piani futuri
La tecnologia di nuova concezione è stata applicata alle riprese video riprese da una telecamera 4K di più lavoratori che imballano in una fabbrica. È stato confermato che La dimensione dei dati potrebbe essere ridotta a 1/10 della dimensione dei dati della tecnologia di compressione convenzionale, senza un deterioramento della precisione del riconoscimento. Si prevede che questa tecnologia verrà utilizzata per applicazioni che non richiedono prestazioni rigorose in tempo reale, nonché per l'analisi avanzata dei dati video che combina più dati video archiviati nel cloud, dati dei sensori e dati sulle prestazioni, come le vendite.
Fujitsu Laboratories sta valutando questa tecnologia in una varietà di casi e sta conducendo ulteriori attività di ricerca e sviluppo per migliorare ulteriormente le prestazioni di compressione. La multinazionale prevede di commercializzare questa tecnologia entro la fine dell'anno fiscale 2020 e di introdurla in una varietà di applicazioni per diversi settori, tra cui la sua piattaforma di servizi COLOMINA, una soluzione per l'industria manifatturiera.
Ti è piaciuto questo articolo?
Iscriviti al nostro Nutrire e non ti perderai nulla.