Google DeepMind: ఈ AI తో టెక్స్ట్ ప్రాంప్ట్లను ఉపయోగించి సౌండ్ట్రాక్లు తయారు చేయచ్చు
గూగుల్ DeepMind కొత్త కృత్రిమ మేధస్సు (AI) సాధనాన్ని పరిచయం చేసింది. ఇది వీడియోల కోసం సౌండ్ట్రాక్లను రూపొందించగలదు. ఈ టూల్ ఆడియోను సృష్టించడానికి వీడియో కంటెంట్, టెక్స్ట్ ప్రాంప్ట్లు రెండింటినీ ఉపయోగిస్తుంది. ఇది డ్రామా స్కోర్, రియలిస్టిక్ సౌండ్ ఎఫెక్ట్స్ లేదా క్యారెక్టర్లతో సమలేఖనం చేసే డైలాగ్తో పాటు వీడియో టోన్తో సన్నివేశాలను రూపొందించడానికి వినియోగదారులను అనుమతిస్తుంది. DeepMind వెబ్సైట్ AI సామర్థ్యాల ఉదాహరణలను ప్రదర్శిస్తుంది.
ఇది ఎలా పని చేస్తుంది?
AI టూల్ నిర్దిష్ట టెక్స్ట్ ప్రాంప్ట్ల ఆధారంగా ఆడియోను రూపొందించగలదు. ఉదాహరణకు, సైబర్పంక్ తరహా సిటీస్కేప్లో కారు డ్రైవింగ్ చేస్తున్న వీడియో కోసం సౌండ్ట్రాక్ను రూపొందించడానికి Google ప్రాంప్ట్ "కార్స్ స్కిడ్డింగ్, కార్ ఇంజన్ థ్రాట్లింగ్, ఏంజెలిక్ ఎలక్ట్రానిక్ మ్యూజిక్"ని ఉపయోగించింది. మరో ఉదాహరణ "నీటి కింద పల్సేటింగ్ జెల్లీ ఫిష్, సముద్ర జీవులు, సముద్రం" అనే ప్రాంప్ట్ని ఉపయోగించి నీటి అడుగున సౌండ్స్కేప్ను రూపొందించడం జరిగింది. టెక్స్ట్ ప్రాంప్ట్లను ఉపయోగించడానికి ఎంపిక ఉన్నప్పటికీ, ఈ సాధనాన్ని ఉపయోగించడం కోసం అవి తప్పనిసరి కాదు.
ఈ టూల్ అపరిమిత ఆడియో ఎంపికలను అందిస్తుంది
DeepMind కొత్త AI సాధనం వినియోగదారులు ఉత్పత్తి చేయబడిన ఆడియోను వీడియోలోని సంబంధిత దృశ్యాలతో ఖచ్చితంగా సమలేఖనం చేయవలసిన అవసరం లేదు. ఈ సాధనం వీడియోల కోసం అపరిమిత సంఖ్యలో సౌండ్ట్రాక్లను ఉత్పత్తి చేయగలదు, వినియోగదారులకు అంతులేని ఆడియో ఎంపికలను అందిస్తుంది. ఈ ఫీచర్ దీన్ని ElevenLabs సౌండ్ ఎఫెక్ట్స్ జనరేటర్ వంటి ఇతర సారూప్య సాధనాల నుండి వేరు చేస్తుంది, ఇది ఆడియోను రూపొందించడానికి టెక్స్ట్ ప్రాంప్ట్లను కూడా ఉపయోగిస్తుంది.
ఇది ఆడియో-వీడియో జత చేయడాన్ని సులభతరం చేస్తుంది
AI టూల్ ఆడియో, వీడియో, ఉల్లేఖనాలపై శిక్షణ పొందింది. ఇందులో ధ్వని వివరణాత్మక వివరణలు అలాగే మాట్లాడే డైలాగ్ల ట్రాన్స్క్రిప్ట్లు ఉంటాయి. ఈ శిక్షణ వీడియో-టు-ఆడియో జనరేటర్ని దృశ్యాలతో ఆడియో ఈవెంట్లను ఖచ్చితంగా సరిపోల్చడానికి అనుమతిస్తుంది. ఇది DeepMind's Veo, Sora వంటి సాధనాల నుండి AI- రూపొందించిన వీడియోతో ఆడియోను జత చేసే విధానాన్ని సమర్థవంతంగా సులభతరం చేస్తుంది. అయితే, డీప్మైండ్ ప్రస్తుతం మెరుగుపరచడానికి పని చేస్తున్న ఈ సాధనానికి కొన్ని పరిమితులు ఉన్నాయి.
టెస్టింగ్ దశలో AI టూల్
DeepMind కొత్త AI టూల్ పరిమితుల్లో ఒకటి పెదవి కదలికను డైలాగ్తో సమకాలీకరించగల సామర్థ్యం, ఇది ప్రస్తుతం మెరుగుపరచబడుతోంది. వీడియో-టు-ఆడియో సిస్టమ్ నాణ్యత కూడా వీడియో నాణ్యతపై ఆధారపడి ఉంటుంది; గ్రైనీ లేదా వక్రీకరించిన వీడియోలు ఆడియో నాణ్యతలో గుర్తించదగిన తగ్గుదలకు దారితీస్తాయి. సాధారణ ఉపయోగం కోసం సాధనం ఇంకా అందుబాటులో లేదు, ఎందుకంటే దీనికి కఠినమైన భద్రతా అంచనాలు, పరీక్ష ఇంకా అవసరం.