AI: టెక్నాలజీ టాప్లో AI… కానీ PDF ముందు ఎందుకు ఫెయిల్?
ఈ వార్తాకథనం ఏంటి
ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ (AI) ఎంత వేగంగా అభివృద్ధి చెందుతున్నా... ఇప్పటికీ సాధారణంగా ఎక్కువగా ఉపయోగించే PDF ఫైళ్ల విషయంలో మాత్రం తడబడుతోంది. ఇటీవల టెక్ వ్యాపారవేత్త ల్యూక్ ఐగెల్ తన స్నేహితులతో కలిసి జెఫ్రీ ఎప్స్టీన్ ఆస్తికి సంబంధించిన దాదాపు 20 వేల పేజీల డాక్యుమెంట్లను పరిశీలించాల్సి వచ్చింది. అయితే PDF వ్యూయర్ వాడటం కష్టంగా మారింది. ముఖ్యంగా కావాల్సిన సమాచారం కోసం సెర్చ్ చేయాలంటే OCR నాణ్యత బలహీనంగా ఉండటంతో తీవ్ర ఇబ్బందులు ఎదురయ్యాయి. AI సాఫ్ట్వేర్, ఫిజిక్స్ వంటి క్లిష్ట సమస్యలను పరిష్కరించే స్థాయికి చేరుకున్నా... PDF మాత్రం పెద్ద సవాల్గా మారిందని డేటా కంపెనీ 'సర్జ్' సీఈఓ ఎడ్విన్ చెన్ వ్యాఖ్యానించారు.
వివరాలు
HTMLలా క్రమం లేదు… అందుకే AIకి గందరగోళం
ఆయన వ్యాఖ్యానిస్తూ... ఇది AI ప్రధాన లోపాల్లో ఒకటని చెప్పారు. PDF నుంచి ఖచ్చితమైన సమాచారాన్ని తీసుకురమ్మంటే, కొన్ని AI మోడళ్లు అసలు విషయాన్ని వేరుచేయకుండా మొత్తం డాక్యుమెంట్ను సంక్షిప్తంగా చెప్పేస్తాయి. మరికొన్ని సందర్భాల్లో ఫుట్నోట్లలో ఉన్న వివరాలను ప్రధాన టెక్స్ట్తో కలిపేసి గందరగోళం సృష్టిస్తాయి. అసలు సమస్య ఏమిటంటే PDF ఫార్మాట్ను యంత్రాలు సులభంగా చదవడానికి కాకుండా, పేజీపై ఎలా కనిపిస్తుందో అదే రూపంలో చూపించడానికి 1990లలో అడోబ్ రూపొందించింది. అందుకే దాని నుంచి స్పష్టమైన సమాచారాన్ని వేరుచేయడం AIకి అంత సులభం కావడం లేదు. HTMLలా లాజికల్ క్రమంలో టెక్స్ట్ ఉండదు. అక్షరాల కోడ్లు, వాటి స్థానాలు, పేజీ ఆకృతి వంటి సూచనలతో మాత్రమే ఉంటుంది.
వివరాలు
OCR గందరగోళం… AIకి PDFలే పెద్ద సవాల్!
OCR టెక్నాలజీ చిత్రాల్లోని అక్షరాలను మళ్లీ టెక్స్ట్గా మార్చగలిగినా, ముఖ్యంగా రెండు కాలమ్స్ ఉన్న అకాడమిక్ పేపర్లలో గందరగోళ ఫలితాలు వస్తుంటాయి. దీంతో AIకి పూర్తి స్థాయిలో అర్థం కావడం కష్టమవుతోంది. అంతేకాదు, ఇప్పటి వరకు ఎక్కువ మోడళ్లకు PDFలపై శిక్షణ కూడా తక్కువగానే ఉంది. అయితే ఇప్పుడు అధిక నాణ్యత గల డేటా కోసం AI అభివృద్ధి సంస్థలు PDFలపై దృష్టి సారిస్తున్నాయి. ప్రభుత్వ నివేదికలు, పాఠ్యపుస్తకాలు, పరిశోధనా పత్రాలు అన్ని కూడా ఎక్కువగా PDF రూపంలోనే ఉండటంతో భవిష్యత్తులో ఇవి AI శిక్షణకు కీలకంగా మారే అవకాశముందని నిపుణులు అభిప్రాయపడుతున్నారు.