Google DeepMind: ఈ AI తో టెక్స్ట్ ప్రాంప్ట్‌లను ఉపయోగించి సౌండ్‌ట్రాక్‌లు తయారు చేయచ్చు

వ్రాసిన వారు Sirish Praharaju

Jun 19, 2024

09:07 am

ఈ వార్తాకథనం ఏంటి

గూగుల్ DeepMind కొత్త కృత్రిమ మేధస్సు (AI) సాధనాన్ని పరిచయం చేసింది. ఇది వీడియోల కోసం సౌండ్‌ట్రాక్‌లను రూపొందించగలదు. ఈ టూల్ ఆడియోను సృష్టించడానికి వీడియో కంటెంట్, టెక్స్ట్ ప్రాంప్ట్‌లు రెండింటినీ ఉపయోగిస్తుంది. ఇది డ్రామా స్కోర్, రియలిస్టిక్ సౌండ్ ఎఫెక్ట్స్ లేదా క్యారెక్టర్‌లతో సమలేఖనం చేసే డైలాగ్‌తో పాటు వీడియో టోన్‌తో సన్నివేశాలను రూపొందించడానికి వినియోగదారులను అనుమతిస్తుంది. DeepMind వెబ్‌సైట్ AI సామర్థ్యాల ఉదాహరణలను ప్రదర్శిస్తుంది.

యూసేజ్

ఇది ఎలా పని చేస్తుంది?

AI టూల్ నిర్దిష్ట టెక్స్ట్ ప్రాంప్ట్‌ల ఆధారంగా ఆడియోను రూపొందించగలదు. ఉదాహరణకు, సైబర్‌పంక్ తరహా సిటీస్కేప్‌లో కారు డ్రైవింగ్ చేస్తున్న వీడియో కోసం సౌండ్‌ట్రాక్‌ను రూపొందించడానికి Google ప్రాంప్ట్ "కార్స్ స్కిడ్డింగ్, కార్ ఇంజన్ థ్రాట్లింగ్, ఏంజెలిక్ ఎలక్ట్రానిక్ మ్యూజిక్"ని ఉపయోగించింది. మరో ఉదాహరణ "నీటి కింద పల్సేటింగ్ జెల్లీ ఫిష్, సముద్ర జీవులు, సముద్రం" అనే ప్రాంప్ట్‌ని ఉపయోగించి నీటి అడుగున సౌండ్‌స్కేప్‌ను రూపొందించడం జరిగింది. టెక్స్ట్ ప్రాంప్ట్‌లను ఉపయోగించడానికి ఎంపిక ఉన్నప్పటికీ, ఈ సాధనాన్ని ఉపయోగించడం కోసం అవి తప్పనిసరి కాదు.

బహుముఖ ప్రజ్ఞ

ఈ టూల్ అపరిమిత ఆడియో ఎంపికలను అందిస్తుంది

DeepMind కొత్త AI సాధనం వినియోగదారులు ఉత్పత్తి చేయబడిన ఆడియోను వీడియోలోని సంబంధిత దృశ్యాలతో ఖచ్చితంగా సమలేఖనం చేయవలసిన అవసరం లేదు. ఈ సాధనం వీడియోల కోసం అపరిమిత సంఖ్యలో సౌండ్‌ట్రాక్‌లను ఉత్పత్తి చేయగలదు, వినియోగదారులకు అంతులేని ఆడియో ఎంపికలను అందిస్తుంది. ఈ ఫీచర్ దీన్ని ElevenLabs సౌండ్ ఎఫెక్ట్స్ జనరేటర్ వంటి ఇతర సారూప్య సాధనాల నుండి వేరు చేస్తుంది, ఇది ఆడియోను రూపొందించడానికి టెక్స్ట్ ప్రాంప్ట్‌లను కూడా ఉపయోగిస్తుంది.

శిక్షణ,అప్లికేషన్

ఇది ఆడియో-వీడియో జత చేయడాన్ని సులభతరం చేస్తుంది

AI టూల్ ఆడియో, వీడియో, ఉల్లేఖనాలపై శిక్షణ పొందింది. ఇందులో ధ్వని వివరణాత్మక వివరణలు అలాగే మాట్లాడే డైలాగ్‌ల ట్రాన్‌స్క్రిప్ట్‌లు ఉంటాయి. ఈ శిక్షణ వీడియో-టు-ఆడియో జనరేటర్‌ని దృశ్యాలతో ఆడియో ఈవెంట్‌లను ఖచ్చితంగా సరిపోల్చడానికి అనుమతిస్తుంది. ఇది DeepMind's Veo, Sora వంటి సాధనాల నుండి AI- రూపొందించిన వీడియోతో ఆడియోను జత చేసే విధానాన్ని సమర్థవంతంగా సులభతరం చేస్తుంది. అయితే, డీప్‌మైండ్ ప్రస్తుతం మెరుగుపరచడానికి పని చేస్తున్న ఈ సాధనానికి కొన్ని పరిమితులు ఉన్నాయి.

భవిష్యత్ పరిణామాలు

టెస్టింగ్ దశలో AI టూల్

DeepMind కొత్త AI టూల్ పరిమితుల్లో ఒకటి పెదవి కదలికను డైలాగ్‌తో సమకాలీకరించగల సామర్థ్యం, ఇది ప్రస్తుతం మెరుగుపరచబడుతోంది. వీడియో-టు-ఆడియో సిస్టమ్ నాణ్యత కూడా వీడియో నాణ్యతపై ఆధారపడి ఉంటుంది; గ్రైనీ లేదా వక్రీకరించిన వీడియోలు ఆడియో నాణ్యతలో గుర్తించదగిన తగ్గుదలకు దారితీస్తాయి. సాధారణ ఉపయోగం కోసం సాధనం ఇంకా అందుబాటులో లేదు, ఎందుకంటే దీనికి కఠినమైన భద్రతా అంచనాలు, పరీక్ష ఇంకా అవసరం.