Az OmniParser V2 értelmezi a képernyőfotók elemeit

A grafikus felhasználói felületek (GUI) automatizálása eddig komoly akadályokba ütközött, mivel az MI-alapú modellek számára nehézséget jelentett a képernyőelemek pontos értelmezése és az interakciók végrehajtása.

Az egyik legnagyobb kihívás az volt, hogy az általános nyelvi modellek (LLM-ek) nem tudták megbízhatóan azonosítani a felhasználói inter

itbusiness.hu9 hónapja
Tovább olvasom

Még több friss hír

       

Hangos lapszemle

...még több adást akarok!

       

Kapcsolódó hírek

Egyre több autót ad el a Xiaomi

zoldjarmuipar.hu1 napja