Google DeepMind: ఈ AI తో టెక్స్ట్ ప్రాంప్ట్లను ఉపయోగించి సౌండ్ట్రాక్లు తయారు చేయచ్చు
ఈ వార్తాకథనం ఏంటి
గూగుల్ DeepMind కొత్త కృత్రిమ మేధస్సు (AI) సాధనాన్ని పరిచయం చేసింది. ఇది వీడియోల కోసం సౌండ్ట్రాక్లను రూపొందించగలదు.
ఈ టూల్ ఆడియోను సృష్టించడానికి వీడియో కంటెంట్, టెక్స్ట్ ప్రాంప్ట్లు రెండింటినీ ఉపయోగిస్తుంది.
ఇది డ్రామా స్కోర్, రియలిస్టిక్ సౌండ్ ఎఫెక్ట్స్ లేదా క్యారెక్టర్లతో సమలేఖనం చేసే డైలాగ్తో పాటు వీడియో టోన్తో సన్నివేశాలను రూపొందించడానికి వినియోగదారులను అనుమతిస్తుంది.
DeepMind వెబ్సైట్ AI సామర్థ్యాల ఉదాహరణలను ప్రదర్శిస్తుంది.
యూసేజ్
ఇది ఎలా పని చేస్తుంది?
AI టూల్ నిర్దిష్ట టెక్స్ట్ ప్రాంప్ట్ల ఆధారంగా ఆడియోను రూపొందించగలదు.
ఉదాహరణకు, సైబర్పంక్ తరహా సిటీస్కేప్లో కారు డ్రైవింగ్ చేస్తున్న వీడియో కోసం సౌండ్ట్రాక్ను రూపొందించడానికి Google ప్రాంప్ట్ "కార్స్ స్కిడ్డింగ్, కార్ ఇంజన్ థ్రాట్లింగ్, ఏంజెలిక్ ఎలక్ట్రానిక్ మ్యూజిక్"ని ఉపయోగించింది.
మరో ఉదాహరణ "నీటి కింద పల్సేటింగ్ జెల్లీ ఫిష్, సముద్ర జీవులు, సముద్రం" అనే ప్రాంప్ట్ని ఉపయోగించి నీటి అడుగున సౌండ్స్కేప్ను రూపొందించడం జరిగింది.
టెక్స్ట్ ప్రాంప్ట్లను ఉపయోగించడానికి ఎంపిక ఉన్నప్పటికీ, ఈ సాధనాన్ని ఉపయోగించడం కోసం అవి తప్పనిసరి కాదు.
బహుముఖ ప్రజ్ఞ
ఈ టూల్ అపరిమిత ఆడియో ఎంపికలను అందిస్తుంది
DeepMind కొత్త AI సాధనం వినియోగదారులు ఉత్పత్తి చేయబడిన ఆడియోను వీడియోలోని సంబంధిత దృశ్యాలతో ఖచ్చితంగా సమలేఖనం చేయవలసిన అవసరం లేదు.
ఈ సాధనం వీడియోల కోసం అపరిమిత సంఖ్యలో సౌండ్ట్రాక్లను ఉత్పత్తి చేయగలదు, వినియోగదారులకు అంతులేని ఆడియో ఎంపికలను అందిస్తుంది.
ఈ ఫీచర్ దీన్ని ElevenLabs సౌండ్ ఎఫెక్ట్స్ జనరేటర్ వంటి ఇతర సారూప్య సాధనాల నుండి వేరు చేస్తుంది, ఇది ఆడియోను రూపొందించడానికి టెక్స్ట్ ప్రాంప్ట్లను కూడా ఉపయోగిస్తుంది.
శిక్షణ,అప్లికేషన్
ఇది ఆడియో-వీడియో జత చేయడాన్ని సులభతరం చేస్తుంది
AI టూల్ ఆడియో, వీడియో, ఉల్లేఖనాలపై శిక్షణ పొందింది. ఇందులో ధ్వని వివరణాత్మక వివరణలు అలాగే మాట్లాడే డైలాగ్ల ట్రాన్స్క్రిప్ట్లు ఉంటాయి.
ఈ శిక్షణ వీడియో-టు-ఆడియో జనరేటర్ని దృశ్యాలతో ఆడియో ఈవెంట్లను ఖచ్చితంగా సరిపోల్చడానికి అనుమతిస్తుంది.
ఇది DeepMind's Veo, Sora వంటి సాధనాల నుండి AI- రూపొందించిన వీడియోతో ఆడియోను జత చేసే విధానాన్ని సమర్థవంతంగా సులభతరం చేస్తుంది.
అయితే, డీప్మైండ్ ప్రస్తుతం మెరుగుపరచడానికి పని చేస్తున్న ఈ సాధనానికి కొన్ని పరిమితులు ఉన్నాయి.
భవిష్యత్ పరిణామాలు
టెస్టింగ్ దశలో AI టూల్
DeepMind కొత్త AI టూల్ పరిమితుల్లో ఒకటి పెదవి కదలికను డైలాగ్తో సమకాలీకరించగల సామర్థ్యం, ఇది ప్రస్తుతం మెరుగుపరచబడుతోంది.
వీడియో-టు-ఆడియో సిస్టమ్ నాణ్యత కూడా వీడియో నాణ్యతపై ఆధారపడి ఉంటుంది; గ్రైనీ లేదా వక్రీకరించిన వీడియోలు ఆడియో నాణ్యతలో గుర్తించదగిన తగ్గుదలకు దారితీస్తాయి.
సాధారణ ఉపయోగం కోసం సాధనం ఇంకా అందుబాటులో లేదు, ఎందుకంటే దీనికి కఠినమైన భద్రతా అంచనాలు, పరీక్ష ఇంకా అవసరం.