Identyfikacja następuje prawie natychmiastowo
Co rusz w sieci pojawiają się informacje o różnych witrynach, które stanowią interfejs dla oprogramowania wykrywającego znajdujące się na nich obiekty. Niektóre ograniczają się do konkretnego typu scen i wymagają sporej interakcji ze strony użytkownika. Niektóre jak system Microsoftu, który ma określać wiek, wywołują spazmy śmiechu. Jeszcze inne, jak niedawno opisywany przez nas projekt Wolfram Research, mają ambicje rozpoznawać wszystko. Na nic jednak taka technologia, gdy nie jest łatwa w użyciu i bezbłędna. Dzięki pracom Qualcomm możemy liczyć na automatyzację procesu rozpoznawania obiektów i jej zintegrowanie z aparatami cyfrowymi.
Wprawdzie trudno powiedzieć na ile poniższa prezentacja jest dokładnie przygotowaną prezentacją, a na ile pokazuje realne możliwości platformy Qualcomm, to niewątpliwie robi wrażenie. Wystarczy pokazać zdjęcie kamerze, a oprogramowanie prawie natychmiast decyduje co widzi w kadrze. I czyni to bezbłędnie.
Cały system wykorzystuje platformę sprzętową Qualcomm Zeroth, która koncentruje się na efektywnym wykorzystaniu sieci neuronowych i uczenia maszynowego. Istnieje od kilku lat, jest stale udoskonalana i wzbogacana o nowe funkcje. Tagowanie zdjęć, o którym Qualcomm mówił już podczas MWC2015, wydaje się kwintesencją wszystkich powiązanych z Zeroth rozwiązań.
Wprowadzenie systemu automatycznej detekcji obiektów do aparatów cyfrowych, a skoro pracuje nad nimi Qualcomm, to również do smartfonów, wydaje się realne. Kiedy, to inne pytanie. Choć zgodnie z zapowiedziami z MWC 2015 technologię Zeroth wykorzysta chipset Snapdragon 820, który ma trafić między innymi do LG G4 Pro.
Szybkie rozpoznawanie, a co za tym idzie odpowiednie tagowanie zdjęć, znacznie ułatwiłoby nam życie. Bo choć tagi, czyli tak zwane słowa kluczowe, w systemie metadanych IPTC egzystują już od ponad dwóch dekad, to czy przeciętny użytkownik aparatu z nich korzysta? Gdyby korzystał każdy, to wprowadzanie takich rozwiązań, jak automatyczne sortowanie zdjęć według tematyki przez Google Photos czy Flickr nie byłoby konieczne. Wszystkie informacje odczytywane byłyby z metadanych zdjęcia. I gotowe.
Źródło: petapixel
Komentarze
3