খালিদ আহমেদ রাজা
প্রকাশ : ২৪ জানুয়ারি ২০২৬ ১২:০৫ পিএম
কৃত্রিম বুদ্ধিমত্তার মাধ্যমে ছবি তৈরি ও সম্পাদনার ক্ষেত্রে আরও এক ধাপ এগোল ওপেনএআই। প্রতিষ্ঠানটি সম্প্রতি নতুন একটি ইমেজ জেনারেশন মডেল ‘জিপিটি ইমেজ ১.৫’ উন্মোচন করেছে, যা এখন থেকে চ্যাটজিপিটি ব্যবহারকারীরাও ব্যবহার করতে পারবেন। পাশাপাশি, এই মডেলটি এপিআইয়ের মাধ্যমে অন্য সফটওয়্যার ও প্লাটফর্মেও সংযুক্ত করা সম্ভব। নতুন মডেলটি আগের তুলনায় নির্দেশনা আরও ভালোভাবে অনুসরণ করতে সক্ষম, ছবি সম্পাদনা হবে আরও নিখুঁতভাবে এবং ছবি তৈরির গতি বাড়বে প্রায় চারগুণ পর্যন্ত।
ওপেনএআই জানিয়েছে, নতুন মডেলটি ব্যবহারকারীদের কল্পনাশক্তিকে বাস্তবে রূপ দিতে আরও শক্তিশালী ও সহজ সরঞ্জাম হিসেবে কাজ করবে। চ্যাটজিপিটিতে আলাদা ইন্টারফেস যুক্ত করা হয়েছে, যা একটি ‘ক্রিয়েটিভ স্টুডিও’ হিসেবে কাজ করবে। ব্যবহারকারীরা এখানে সহজেই ছবি দেখতে, সম্পাদনা করতে এবং নতুন ধারণা অনুপ্রেরণা হিসেবে নিতে পারবেন। এই ইন্টারফেস ব্যবহার করে ছবি তৈরি করা এখন আরও ভিজ্যুয়াল অভিজ্ঞতা হয়ে উঠেছে।
এআই প্রযুক্তির বাজারে প্রতিযোগিতা দিন দিন তীব্র হচ্ছে। বিশেষ করে গুগলের জেমিনি সিরিজ ও তাদের নতুন ইমেজ জেনারেটর ‘ন্যানো বানানা প্রো’-এর সঙ্গে ওপেনএআইয়ের লড়াই প্রকাশ্য। গত মাসে ওপেনএআইয়ের প্রধান নির্বাহী স্যাম অল্টম্যান একটি অভ্যন্তরীণ বার্তায় ‘কোড রেড’ ঘোষণা করেন। সেখানে তিনি জানান, বাজারে নেতৃত্ব ধরে রাখতে দ্রুত নতুন প্রযুক্তি আনা হবে। এরই ধারাবাহিকতায় ওপেনএআই গত সপ্তাহে জিপিটি-৫.২ মডেল ছাড়ে এবং এবার নতুন ইমেজ মডেলটি আনে।
আগের ইমেজ মডেল ‘জিপিটি ইমেজ ১’ এপ্রিলে প্রকাশিত হয়েছিল। নতুন সংস্করণে যুক্ত হয়েছে উন্নত পোস্ট-প্রোডাকশন সুবিধা, যা ছবির মুখাবয়ব, আলো, রঙ এবং কম্পোজিশনের সামঞ্জস্য আরও সহজ করবে। এআই দিয়ে ছবি সম্পাদনায় সব সময়ই একটি বড় চ্যালেঞ্জ ছিলÑ ছোট একটি পরিবর্তনের অনুরোধে পুরো ছবি বদলে যাওয়া। নতুন মডেলটি এই সমস্যার সমাধান করতে সক্ষম।
ওপেনএআইয়ের অ্যাপ্লিকেশন প্রধান নির্বাহী ফিদজি সিমো এক ব্লগ পোস্টে বলেন, ‘ছবি তৈরির অভিজ্ঞতাকে আরও ভিজ্যুয়াল এবং ব্যবহারকারীবান্ধব করা হচ্ছে। এখন ব্যবহারকারীরা ট্রেন্ডিং প্রম্পট, প্রস্তুত ফিল্টার ও অন্যান্য সৃজনশীল উপাদান থেকে অনুপ্রেরণা নিতে পারবেন।’
এ ছাড়া সার্চ ফলাফলেও আরও ভিজ্যুয়াল তথ্য প্রদর্শনের পরিকল্পনা রয়েছে। এতে ব্যবহারকারীরা যেমন মাপজোক রূপান্তর বা খেলাধুলার স্কোর দেখতে পারবেন, তেমনই আরও দ্রুত তথ্য ও ধারণা বাস্তবায়ন করতে পারবেন। ওপেনএআই স্পষ্টভাবে জানাচ্ছে, লক্ষ্য একটাইÑ ব্যবহারকারীর ভাবনাকে দ্রুত বাস্তবে রূপ দেওয়া। শব্দের পাশাপাশি ছবি ব্যবহার করেই গল্প বলার অভিজ্ঞতা এখন তাদের নতুন অগ্রাধিকার।
‘জিপিটি ইমেজ ১.৫’-এর মাধ্যমে ওপেনএআই কেবল প্রযুক্তি উন্নয়নে সীমাবদ্ধ নয়, বরং ব্যবহারকারীদের সৃজনশীল সম্ভাবনাকেও নতুন মাত্রা দিতে প্রস্তুত। এই নতুন মডেলটি AI শিল্পে ছবি তৈরির অভিজ্ঞতাকে আরও গতিশীল, নিখুঁত ও ভিজ্যুয়াল বানানোর দিকে বড় পদক্ষেপ হিসেবে দেখা হচ্ছে।