Usługa AI Vision
25.04.24r.
Przyszłość przetwarzania wizualnego z Microsoft AI Vision! Ta zaawansowana technologia wykorzystuje algorytmy uczenia maszynowego do analizy obrazów i wideo, oferując narzędzia takie jak OCR, analiza obrazu, rozpoznawanie twarzy i analiza wideo.
Usługa
AI Vision to zaawansowana technologia firmy Microsoft, oparta na sztucznej inteligencji, która umożliwia przetwarzanie i interpretowanie obrazów w sposób podobny do ludzkiego postrzegania. Wykorzystuje ona algorytmy uczenia maszynowego i głębokiego uczenia do analizy obrazów i wideo, aby wykrywać obiekty, rozpoznawać wzorce i przeprowadzać analizę wizualną. Usługa Azure AI Vision oferuje następujące narzędzia:
-
Optyczne rozpoznawanie znaków (OCR) - Usługa optycznego rozpoznawania znaków (OCR) umożliwia wyodrębnienie tekstu z obrazów. Usługa współpracuje z tekstem prezentowanym na różnych powierzchniach i tłach. Przetwarzanie tekstu może obejmować dokumenty takie jak: faktury, paragony, plakaty, wizytówki, listy i tablice.
-
Analiza obrazu - Usługa analizy obrazów wyodrębnia wiele funkcji wizualnych z obrazów, takich jak obiekty, twarze, zawartość dla dorosłych i automatycznie generowane opisy tekstu. Usługa również pozwala dokonać kategoryzacji obrazów na podstawie własnego modelu uczenia maszynowego.
-
Rozpoznawanie twarzy - Usługa rozpoznawania twarzy wykorzystuje algorytmy sztucznej inteligencji, których zadaniem jest wykrywanie oraz rozpoznawanie twarzy. Ponadto usługa rozpoznawania twarzy pozwala wykryć obiekty zasłaniające twarz (okulary, chustę) jak również określić emocje badanej twarzy. Oprogramowanie do rozpoznawania twarzy może być wykorzystywane w wielu różnych scenariuszach, takich jak identyfikacja osób, bezobsługowa kontrola dostępu lub rozmycie twarzy w celu zachowania prywatności.
-
Analiza wideo - Analiza wideo obejmuje funkcje związane z przetwarzaniem strumienia wideo. Usługa umożliwia analizę przestrzenna obrazu i przeszukiwanie zasobów wideo. Analiza przestrzenna analizuje obecność i ruch osób w wideo i generuje zdarzenia, na które mogą reagować inne systemy. Funkcja przeszukiwania wideo umożliwia utworzenie indeksu filmów wideo, które można wyszukiwać za pomocą języka naturalnego.
Budując własne rozwiązania z wykorzystaniem AI Vision możemy skorzystać z oferowanego interfejsu
REST API. Przygotowane komponenty programistyczne (Software development kits - SDKs) Azure AI Vision umożliwiają programistom z wykorzystaniem języków programowania: C#, Python, Java, Node.js, w pełni budowanie rozwiązań analitycznych. To między innymi: tworzenie indeksu, dodawanie do niego dokumentów (filmów i obrazów) oraz wyszukiwanie przy użyciu języka naturalnego. Deweloperzy mogą definiować schematy metadanych dla każdego indeksu i pozyskiwać metadane do usługi, aby ułatwić ich pobieranie. Programiści mogą także określić, jakie funkcje mają zostać wyodrębnione z indeksu (wizja, mowa) i filtrować wyszukiwanie na podstawie tych funkcji.
Mechanizmy AI Vision można przetestować na portalu Vision Studio udostępnianym przez firmę Microsoft:
https://portal.vision.cognitive.azure.com/gallery/featured