Zalogowany jako: gość

Forum

Wątek: Be My Eyes i rozpoznawanie zdjęć

Wróć do listy wątków

1 z 2

Następna

1 z 22: Numernabis

W androidzie uruchomili już opcję rozpoznawania obrazów/zdjęć w Be My Eyes, ale...
No właśnie, rozpoznaje zrobione zdjęcie, a jak rozpoznać, użyć Be My Eyes do opisu zdjęcia z pamięci telefonu? Szukałem, ale nie znalazłem.
Znajdź sobie zajęcie, które kochasz, a nie przepracujesz w życiu ani jednego dnia.
11.12.2023 16:31

2 z 22: Monia01

Opcji jeszcze nie ma z tego co wiem
*** ?? ??
12.12.2023 09:10

3 z 22: Zuzler

Chyba że tak jak na Iphonie można nie z poziomu Be My Eyes znaleźć zdjęcie, tylko z opcji przy danym zdjęciu wybrać "Rozpoznaj z Be My AI".

12.12.2023 10:57

4 z 22: Monia01

Hm, nie znalazłam nniczegotakiego
*** ?? ??
12.12.2023 10:58

5 z 22: guliwer

Może chodzi o to że nie ma w uprawnieniach aplikacji Be my eyes zdjęć ani galerii?

12.12.2023 11:44

6 z 22: balteam

Jak to wygląda w praktyce? Klikam zrób zdjęcie i powinno robić? jak tk to ile czekacie? u mnie klikam przycisk zrób zdjęcie i czekam i czekam i czekam, nic się nie dzieje
Zapraszam osoby posiadające piesy, lub chcące je posiadać, do dołączenia do grupy o psach przewodnikach.
13.12.2023 08:36

7 z 22: cinkciarzpl

Ballteam tak z 10 sekund
____________Panu się zdaje, że życie polega na tym, żeby dorosnąć. Co? Być dorosłym; zdać egzamin; zadośćuczynić normom. A co to jest norma? Czy pan, jako psychiatra może mi odpowiedzieć? Co to jest norma? Nie może pan, bo to jest g**no.
13.12.2023 12:27

8 z 22: Numernabis

Dokładnie, około 10 sekund i jest opis.
Znajdź sobie zajęcie, które kochasz, a nie przepracujesz w życiu ani jednego dnia.
13.12.2023 14:57

9 z 22: balteam

no to u mnie coś nie trybi,
Zapraszam osoby posiadające piesy, lub chcące je posiadać, do dołączenia do grupy o psach przewodnikach.
13.12.2023 15:22

10 z 22: Numernabis

Udzieliłeś wszystkich uprawnień?
Znajdź sobie zajęcie, które kochasz, a nie przepracujesz w życiu ani jednego dnia.
13.12.2023 19:34

11 z 22: Monia01

Przeinstaluj apkę może?
*** ?? ??
13.12.2023 20:02

12 z 22: balteam

Coś nie tak z omim telefonem, bo wszystkie te apki z aparatu korzystające nie czytają tekstów itd, eh
Zapraszam osoby posiadające piesy, lub chcące je posiadać, do dołączenia do grupy o psach przewodnikach.
14.12.2023 17:53

13 z 22: cinkciarzpl

Ogólnie co do tego całego rozpoznawania zdjęć bezpośrednio z aparatu to ja na dzisiaj nie widzę do tego realnych zastosowań dla nas. Nie zrozumcie mnie źle. Uważam, że potencjał tego jest gigantyczny, ale cała ta technologia jest jeszcze tak niedorozwinięta, że nie można odpowiedzialnie na niej polegać. Po pierwsze primo, że nie można temu udostępnić niczego co nie jest zdjęciem wprost z naszego aparatu, czyli wszelkie memy, fotki z facebooka czy nawet zżuty ekranu odpadają a tam co jak co, ale sprawdzało się to raczej dobrze i zdarzało mi się już np. obchodzić tym wyjątkowo upierdliwe kody captcha czy opisywać sobie okładki płyt. Wszystko fajnie, może zrobią update i będzie cacy. Ale do czasu, bo,
Drugie primo; niestety jakość zdjęć, które wykonujemy my, ślepotki, jest różna a ta technologia działa na zasadzie statystyki, więc jeśli tylko jest jakakolwiek szansa, że zrobimy zdjęcie gorszej jakości np. nie świadomie z powodu złego konta, zbyt małej ilości światła etc, to takie zdjęcie wykonamy a co za tym idzie, ten algorytm zacznie wymyślać na czym świat stoi i co gorsza, będzie w to swoje wymyślanie wplatał okruchy prawdy co na pewno zrobi na nas mylne, choć pozytywne, wrażenie. Przykład niżej. I o ile w przypadku opisania czegoś, co jest takie wyraźniutkie osobiście się nie spotkałem z przekłamaniami na tyle istotnymi, by mieć z tym jakiś problem, to już w wypadku zdjęć wykonywanych przeze mnie powiedzmy w bardziej praktycznych zastosowaniach dzieje się to notorycznie. Pół biedy, gdy chcę np. dla jaj zrobić zdjęcie przestrzeni przed sobą. Dostanę jakiś tam opis, często imponujący szczegółowością, często nawet zgodny z prawdą. Ale po co właściwie miałbym je robić, skoro inne zmysły czasami mogą mi dać w zasadzie podobną wiedzę, a ten opis stanowi pewien miły, bajerancki dodatek? Owszem, takie zdjęcie, w pewnych okolicznościach naprawdę może nam dać masę informacji, których innymi zmysłami nigdy nie uzyskamy. Z tym nie ma się co kłócić. Problem tylko w tym, że nigdy nie możemy być pewni tego, że opis, który my czytamy odzwierciedla prawdę, prawdę i tylko prawdę.
Jednym z takich przykładów jest to, jak ten model radzi sobie z rozpoznawaniem tekstu. Potrafi on to robić bezsprzecznie. Robiłem np.. zdjęcia papierowej gazecie i tak akurat wyszło, że model spisał się wzorowo. Najpierw dostałem opis ogólny, że jest to taki to a taki numer takiej gazety z dnia. Wszystko się zgadzało. Zapytałem o to, jaki tekst tam widzi i dostałem w odpowiedzi faktycznie to, co było tam napisane. Ale gdy tylko wydarzy się jakakolwiek okazja, np. w postaci złej jakości zdjęcia, o której my możemy nie mieć pojęcia w chwili jego wykonywania, to dostaniemy głupoty, o czym jako ślepiątka również nie będziemy mieli pojęcia z powodu plastyczności opisów generowanych przez ten model. Przykładem niech będzie historia z paragonem.
Otóż wybrałem się ostatnio do apteki po leki i postanowiłem dla testu zeskanować paragon z tejże. Za pierwszym podejściem dowiedziałem się, że paragon leży na drewnianym, takim to a takim blacie stołu, jeszcze widać fragmenty pomieszczenia, a tak w ogóle to paragon jest lekko pozginany, co było prawdą. Plus dla gpt.
Przesunąłem się o kilka CM, ciach. Druga fotka. Okazało się, że tym razem widać paragon, który jest pozginany, ale daje się odczytać, że jest to paragon ze sklepu Carefour i opiewa na kwotę 8.50, a widnieje na nim tylko jedna pozycja i jest to…. Ptasie mleczko. Tu też okruchy prawdy. Owszem, cena się zgadzała, to, że paragon się w kieszeni zdążył podniszczyć, też. To, że widniała tam tylko jedna pozycja również. Ale to ptasie Mleczko? No szacun za kreatywność.
Prawdę, całą prawdę i tylko prawdę, z adresem apteki włącznie uzyskałem dopiero po wykonaniu dosłownie kilkunastu zdjęć, z czego spora część była źle zrobiona i zaczął mi opisywać zupełnie nie to, co chciałem. Taki sam efekt, tzn. prawdy i tylko prawdy udało mi się osiągnąć klasycznym ocrem ale po znacznie krótszym czasie
Wnioski wyciągnijcie sami.
____________Panu się zdaje, że życie polega na tym, żeby dorosnąć. Co? Być dorosłym; zdać egzamin; zadośćuczynić normom. A co to jest norma? Czy pan, jako psychiatra może mi odpowiedzieć? Co to jest norma? Nie może pan, bo to jest g**no.
20.12.2023 19:05

14 z 22: Numernabis

Przecież nikt rozsądny nie będzie polegał w stu procentach na tym co opisuje sztuczna inteligencja.
Co do praktycznego wykorzystania to tu się mylisz, niejednokrotnie lepiej się sprawdza np. fotka dla przykładu pizzy z biedry, OCR gada różne teksty, a to co najważniejsze czyli sposób przygotowania już nie, a tu można dopytać i się sprawdza..
Przed chwilą zrobiłem zdjęcie delicji szampańskich, dowiedziałem się właśnie, że to nie te podrabiane, ale właśne delicje, że są o smaku pomarańczy, nawet opisał co i w którym miejscu jakie jest zdjęcie, podał ilość kalori i parę jeszcze innych szczegółów.
Co do opisywania zdjęć z aparatu, z pamięci telefonu to to działa, ale narazie tylko pod iPhone, tutaj również jest to przewidziane..
Przede wszystkim daje nam możliwość dokładnego rozeznania się w terenie, dokładnego rozeznania miejsca gdzie jesteśmy i nie potrzeba do tego drugiej osoby, co najważniejsze to właśnie możliwość dopytywania o szczegóły.
Moim zdaniem świetny program.
Znajdź sobie zajęcie, które kochasz, a nie przepracujesz w życiu ani jednego dnia.
20.12.2023 19:21

15 z 22: pajper

Hubercie, trzy przykłady co prawda na iOS, ale technologia ta sama, a dobrze ilustrują problem.

Pierwsze zdjęcie to tabliczka na drzwi. Zdjęcie wykonane przez osobę widzącą. Tabliczka składa się z Brajlowskiego i czarnodrukowego, w kontraście, napisu Fundacja Prowadnica.
Be my Eyes zaczął opowiadać, że jest to Brajlowski i czarnodrukowy... poradnik wyjaśniający jak postępować z osobami niewidomymi.

Przykład drugi, szachownica, pusta. Usłyszałem, że są to szachy. Po czym, ku memu rosnącemu zdumieniu, zaczął opowiadać mi jakie figury są na szachownicy i ogólną sytuację, z wyraźną przewagą białych. Przewaga ta była wręcz miażdżąca, bo jak mówiłem, na szachownicy ni białych, ni czarnych bierek nie było.

Przykład trzeci, robiłem zdjęcia ekranu drukarki 3d, chcąc sprawdzić czy uda się z nim zmienić coś w ustawieniach.
Powiedział, że to drukarka 3d, nawet podał jej model, zobaczył szpulę filamentu i podał jej kolor i rodzaj. Ale jeśli chodzi o zawartość ekranu, to tu zaczęła się wyobraźnia. Zaczął mi podawać opcje, których tam nie ma, ale które są w menu drukarki 3d Prusy, tylko innego modelu. W dodatku robił to tak wiarygodnie, że mówił, która z nich jest zaznaczona.

Więc, tak, technologia robi ogromne wrażenie, ale nie wiem czy kiedykolwiek będzie gotowa do opisywania naprawdę kluczowo ważnych zdjęć. Możemy dać do neuronówki miliardy danych, ale to wciąż tylko model statystyczny i zawsze jest ryzyko, że akurat to jedno krytycznie ważne zdjęcie będzie rozpoznane źle.
#StandWithUkraine Shoot for the Moon. Even if you miss, you'll land among the stars.
20.12.2023 19:27

16 z 22: Numernabis

W krytycznych sytuacjach raczej wspomagamy się drugą osobą, tak przynajmniej robi ktoś kto myśli rozsądnie.
Znajdź sobie zajęcie, które kochasz, a nie przepracujesz w życiu ani jednego dnia.
20.12.2023 19:33

17 z 22: balteam

No, ale przecież Pajper i Cinkciarz podali masę praktycznych przykładów, skoro zeskanuję puszkę i nie wiem czy to fasola albo kukurydza, on mi zmyśli czasami, to w sumie nigdzie nie mogę na tym polegać, lepiej zadzwonić albo ocr
Zapraszam osoby posiadające piesy, lub chcące je posiadać, do dołączenia do grupy o psach przewodnikach.
20.12.2023 20:05

18 z 22: Numernabis

A kto powiedział, że możesz na tym polegać, to tak samo jak z OCR, nie wystarczy jeden soft, bo nie zawsze rozpozna, zwłaszcza kiedy są błyszczące etykiety.
Znajdź sobie zajęcie, które kochasz, a nie przepracujesz w życiu ani jednego dnia.
20.12.2023 20:25

19 z 22: balteam

Jeśli zmyśla i nie jesteś w stanie rozpoznać czy to fałsz, to po prostu robi się sporo gorsze od ocr, w pierwszej kolejności ocr bym wykorzystał, potem be my eye ai
Na razie wygląda, że nawet w połowie nie można na tym polegać
Zapraszam osoby posiadające piesy, lub chcące je posiadać, do dołączenia do grupy o psach przewodnikach.
20.12.2023 21:23

20 z 22: tomecki

osobiście używam tego głównie do zaspokajania takiej hm... lekkiej ciekawości. np. siedzę sobie gdzieś w pomieszczeniu, np. w urzędzie albo w sali zabaw z dzieckiem i chciałbym tak niezobowiązująco wiedzieć, co tam jest. Druga rzecz to ogólna wiedza, jak się robi zdjęcia. Cykam sobie fotkę czegoś żeby zobaczyć czy wyjdzie to, co chcę żeby wyszło np. rzeczy na stole. Be my AI pisze, że owszem, stół widać, ale jeszcze jest kawalątko nogi prawdopodobnie osoby fotografującej, a tak w ogóle to na ścianach wisi np. tablica. Jeśli to się zgadza, znaczy, że wyszło inaczej niż myślałem. Do czego może się przydać umiejętność robienia zdjęć...być może dla widzącej części rodziny, być może dla równie widzących znajomych.

21.12.2023 11:11

Wróć do listy wątków

1 z 2

Następna

Nawigacja


Copyright (©) 2014-2024, Dawid Pieper