ভয়েস ক্লোনিং
জর্জিনা ফিন্ডলে
প্রকাশ : ০৮ জানুয়ারি ২০২৫ ১০:৫৩ এএম
জর্জিনা ফিন্ডলে
আমার ভাই তার ফোন আমার কানে দিতেই আমি সতর্কবার্তা শুনতে পাই। ‘জেনে অবাক হবেন’Ñ মূলত একটি ইনস্টাগ্রাম রিলসে এক কিশোরকে দেখতে পাই। একটি র্যালির সামনে সংবাদ উপস্থাপনের ঢঙে সে কথাগুলো বলছে। তবে তার কণ্ঠের বদলে একটা ভয়েস ওভার শুনতে পাই। শান্ত ও নিখুঁত উচ্চারণের নারীকণ্ঠে সে বলে চলেছে, ‘ব্রিটিশ ছাত্রদের মধ্যে সম্প্রতি একধরনের আতঙ্ক দেখা দিয়েছে। বিষয়টি আমাদের শিক্ষাব্যবস্থায় এক জটিল সমস্যা হিসেবে আবির্ভূত হয়েছে।’ বিস্মিত আমি সোজা হয়ে বসি। একটি ইউটিউব চ্যানেলের সংবাদ উপস্থাপিকা হিসেবে নিজের কণ্ঠ শোনা অবাক কিছু না। সমস্যা হলো, ভিডিওর কথাগুলো আমার নয়। অথচ কণ্ঠটি নিঃসন্দেহে আমার। কণ্ঠটি বলে যাচ্ছে, ‘ওরা স্কুলে আমাদের জোর করে ইসলাম নিয়ে পড়তে বাধ্য করছে। বিষয়টি নিন্দনীয়।’ আমার কণ্ঠে কট্টর ডানপন্থিদের প্রোপাগান্ডা শুনতে পাওয়াও এক অর্থে রোমহর্ষক। একটি নকল অডিওর সম্মোহনী শক্তি কতটা তা আমি তখন বুঝতে পারি।
ডিপফেকের একটি নতুন পদ্ধতি কৃত্রিম বুদ্ধিমত্তা পরিচালিত ভয়েস ক্লোনিং। ২০২৪ সালে যত স্ক্যাম হয়েছে তার মধ্যে এই প্রযুক্তি তৃতীয়। অধিকাংশ ক্ষেত্রে ভুক্তভোগীদের অনুমতি ব্যতিরেকে তাদের কণ্ঠ নকল করা হয়েছে। ফলে ব্যাংকের সিকিউরিটি চেক পদ্ধতি হুমকির মুখে পড়েছে এবং অনেক ক্ষেত্রে অনেক অর্থ লোপাট হয়েছে। অনেক ভুক্তভোগী আত্মীয়ের কণ্ঠ শুনে অপরিচিত নম্বরে অর্থ পাঠিয়েছে। আমার ভাইকে তার এক বন্ধু এই ক্লিপটি পাঠায়। সে আমার কণ্ঠ চিনতে পেরে অবাক হয়েছে। কিছু অনুসন্ধান করে আমি এর মূল খোঁজার চেষ্টা করি। অবশেষে ইউটিউবে একটি কট্টর ডানপন্থি চ্যানেল খুঁজে পাই। চ্যানেলটিতে ২০ লাখেরও বেশি সাবস্ক্রাইবার। আমেরিকান চ্যানেল হলেও সেখানে বানানের হতশ্রী অবস্থা। অবাক হয়ে লক্ষ করিÑ চ্যানেলে আপ্লোড করা বিগত ১২টি ভিডিওর মধ্যে আটটিতে আমার কণ্ঠ ব্যবহার করা হয়েছে। আমি চ্যানেলে আরেকটু স্ক্রলিং করি। খেয়াল করলামÑ পাঁচ মাস আগে আমার কণ্ঠ ব্যবহার করে একটি ভিডিও বানানো হয়েছে। ভিডিওতে ১০ মিলিয়ন ভিউ। কণ্ঠটি ঠিক আমার মতো। কিন্তু কথা বলার সময় একধরনের যান্ত্রিকতা রয়েছে। এসব দেখে বোঝা যায়Ñ ভয়েসটি কৃত্রিম বুদ্ধিমত্তা দিয়ে বানানো।
যে হারে কৃত্রিম বুদ্ধিমত্তা পরিচালিত ভয়েস ক্লোনিং সফটওয়্যার বেড়ে চলেছে, তা অনেক ক্ষেত্রে শঙ্কা বাড়িয়েছে। ২০২৩ সালের নভেম্বরে লন্ডনের মেয়র সাদিক খানের একটি অডিও ডিপফেক সামাজিক যোগাযোগমাধ্যমে ছড়িয়ে পড়ে। ক্লিপটি সাদিকের মতে একটি ‘বড় শঙ্কা’। অন্তত বিবিসিকে তিনি এমনটিই বলেছেন। তিনি জানান, ‘যদি আপনি জিঘাংসা ছড়াতে চান, তাহলে এরচেয়ে ভালো সময় আর মিলবে না।’ ওই সময় যুক্তরাজ্যের গণতান্ত্রিক রাজনৈতিক ব্যবস্থার প্রতি মানুষের আস্থা এমনিতেই কমতে শুরু করেছে। ৫৮ শতাংশ ব্রিটিশের মতে, রাজনীতিকদের তারা কোনোভাবেই বিশ্বাস করতে পারেন না। তাদের মতে রাজনীতিকরা মানুষের ভাবনাকে ভুল পথে চালিত করে। কৃত্রিম বুদ্ধিমত্তার ক্ষেত্রে কারও কণ্ঠের স্বত্বাধিকার এখনও আইনিভাবে প্রতিষ্ঠিত নয়। সাদিক নিজে ওই সময় ভীষণ বিরক্ত হয়েছেন। নভেম্বরের পর যুক্তরাষ্ট্রের নিউজ বুলেটিনে অভিনেত্রী স্কারলেট জোহানেসের কণ্ঠ পাওয়ার পর তিনি ওপেনএআইয়ের সঙ্গে রীতিমতো যুদ্ধে নেমে পড়েন। কারণ গত বছরের মে মাসে অভিনেত্রী চ্যাটজিপিটির একটি টেক্সট টু স্পিচ পণ্যে তার কণ্ঠের হুবহু অনুকরণ খুঁজে পান। ফলে মার্চে ওপেনএআই তাদের পণ্য বাজারে ছাড়ার সিদ্ধান্ত পিছিয়ে নেয়। তাদের মতে, ওই সময় পণ্যটি বাজারে ছাড়া ঝুঁকিপূর্ণ। কিছু এআই স্টার্টাপ ব্যবহারকারীদের তারপরও কণ্ঠ ক্লোনিং করার সুবিধা দিচ্ছিল। তবে এক্ষেত্রে তারা কিছুটা সতর্ক অবস্থানে থাকে। ভয়েস ক্লোনিং করলেও তা যেন শনাক্ত করা যায়, তার কিছু নীতিমালা প্রণয়ন করে। তবে যুক্তরাষ্ট্র ও যুক্তরাজ্যের নির্বাচনের আগে বিষয়টি আরও বড় সমস্যা হিসেবে দেখা দিতে শুরু করে। কারণ তখন সতর্কতামূলক পদক্ষেপগুলো কাজে আসছিল না। যুক্তরাষ্ট্রের সিনেটররা একটি ড্রাফট বিল পাস করেন, যেখানে কারও অনুমতি ব্যতিরেকে কণ্ঠ ক্লোনিং করা আইনত দণ্ডনীয় অপরাধ। ইউরোপিয়ান আইডেন্টিটি থেফট অবজারভেটরি সিস্টেম (আইথস) এখন ডিপফেকের নকল শনাক্ত করার জন্য চারটি টুল নির্মাণ করছে। চলতি বছরই সেগুলো তৈরি হওয়ার কথা। আমাদের প্রত্যাশাÑ বিষয়টি আমাদের কণ্ঠের নকল হওয়া রক্ষায় গুরুত্বপূর্ণ ভূমিকা রাখবে। তবে বিশেষজ্ঞদের মতে, আমাদের কপিরাইট আইন এখনও যুগোপযোগী করা যায়নি বলেই নতুন প্রযুক্তি তার সুবিধা নিচ্ছে।
প্রতিষ্ঠানের প্রতি আস্থা কমে যাওয়া যদি সমস্যা হয়ে ওঠে, তাহলে সমাজের বিভিন্ন সম্প্রদায়ের মধ্যে বিভেদ সৃষ্টি করা আরেকটি বড় সমস্যা হয়ে দাঁড়াবে। ক্রমবর্ধমান বিশ্বায়িত, ব্যক্তিগত ও পেশাগত জীবনে মানুষের সহযোগিতার কেন্দ্রবিন্দুতে বিশ্বাস করার ক্ষমতা অনেক হলেও সম্প্রতি প্রযুক্তির বদৌলতে তা ক্ষয়িষ্ণু করার অনেক কাছাকাছি চলে এসেছি আমরা। ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়ের ডিজিটাল ফরেনসিকের অধ্যাপক এবং ডিপফেক শনাক্তকরণের বিশেষজ্ঞ হ্যানি ফরিদ ওয়াশিংটন পোস্টকে বলেছেন যেÑ এই অডিও সংকটের পরিণতি গণসহিংসতা বা ‘নির্বাচন চুরি’র মতো চরম হতে পারে। সহজেই ভয়েস ক্লোন করার এই নতুন ক্ষমতার কী পরিণতি হতে পারে? সম্ভবত এআই ভয়েস ক্লোন আমাদের মৃত প্রিয়জনদের সঙ্গে যোগাযোগের সান্ত্বনা পেতে বা চিকিৎসারতদের কণ্ঠ দিতে সাহায্য করতে পারে। মার্কিন অভিনেতা ভ্যাল কিলমার ২০২২ সালে গলার ক্যানসারের চিকিৎসা করেছেন কৃত্রিম বুদ্ধিমত্তা দিয়ে পুনরুদ্ধার করা একটি ভয়েসের সাথে। আমাদের উদ্ভাবন করার ক্ষমতা খারাপ লক্ষ্যগুলোর দিকে না রেখে মানুষের সেবায় নিয়োজিত হতে পারে।
একজন উপস্থাপক হিসেবে স্বেচ্ছায় স্ক্রিনে আমার ভয়েস শেয়ার করার সময় নিজের কণ্ঠকে এই অবিচ্ছেদ্য, মূল্যবান হিসেবে ভেবেছি। তবে আমার অনুমতি ছাড়া কেউ তা ব্যবহার করবে এমন কিছুতে রাজি হইনি। এটি আমার কাজের অংশও নয়। সম্প্রচারক হিসেবে, আমরা মাঝে মাঝে চিন্তা করি যে ঠান্ডা বা শীতের সময় ভাইরাস কীভাবে আমাদের রেকর্ডিংকে প্রভাবিত করতে পারে। কিন্তু আমার সাম্প্রতিক অভিজ্ঞতা একজনের কণ্ঠ হারানোর ধারণাকে আরও বেশি ভয়ংকর রূপ দিয়েছে।
দ্য গার্ডিয়ান থেকে অনুবাদ : আবেদিন আকাশ