প্রাণরসায়নের কঠিনতম সমস্যার সমাধান

আজ নোবেল পুরস্কার তুলে দেওয়া হবে চলতি বছরের বিজয়ীদের হাতে। সুইডেনের রাজধানী স্টকমহোমের স্টকহোম কনসার্ট হলে ১০ ডিসেম্বর, মঙ্গলবার বাংলাদেশ সময়ে রাত ৯টায় আয়োজিত হবে এ অনুষ্ঠান। চলতি বছর রসায়নে নোবেল পুরস্কার পেয়েছেন ডেভিড বেকার, ডেমিস হাসাবি ও জন জাম্পার। তাঁদের নোবেলজয়ী গবেষণার আদ্যপান্ত...

বেশ কয়েক বছর ধরেই চারদিকে আর্টিফিশিয়াল ইন্টেলিজেন্স বা কৃত্রিম বুদ্ধিমত্তার জয়জয়কার। এবার রসায়ন ও পদার্থবিজ্ঞানের নোবেল পুরস্কারেও কৃত্রিম বুদ্ধিমত্তার জয় হলো। ২০২৪ সালে রসায়নে নোবেল পুরস্কার পাচ্ছেন ডেভিড বেকার, ডেমিস হাসাবি ও জন জাম্পার। অধ্যাপক ডেভিড বেকার পুরস্কারের অর্ধেক পাচ্ছেন কীভাবে একটা প্রোটিনের ত্রিমাত্রিক গঠন থেকে অ্যামিনো অ্যাসিডের সিকোয়েন্স অনুমান করা যায়, তা আবিষ্কার করে। পুরস্কারের বাকি অর্ধেক পাবেন হাসাবি ও জাম্পার, তাঁরা আবিষ্কার করেছেন একটা প্রোটিন সিকোয়েন্স থেকে কীভাবে ত্রিমাত্রিক গঠন অনুমান করা যায়।

পুরস্কার পাওয়া দুই দলের কাজই প্রোটিন নিয়ে। প্রোটিন হলো পৃথিবীর প্রাণের বিল্ডিং ব্লক বা গাঠনিক একক, সব জৈবিক উপস্থিতির মূল উপাদান। রসায়নের দৃষ্টিতে দেখলে, এগুলো বড় আকারের অণু। ছোট আকারের অণু চিন্তা করলে পানির অণু একটা ভালো উদাহরণ। একটা পানির অণুর তুলনায় প্রোটিনের অণুর ভর কয়েক হাজার গুণ হতে পারে। এত বড় অণু সাধারণত এককভাবে তৈরি হয় না। বরং কতগুলো ছোট অণু মিলে একটা বড় আকার ধারণ করে। ছোট অণুগুলোকে বলে মনোমার। দুই থেকে কয়েক হাজার মনোমার মিলে তৈরি হয় একটা পলিমার। প্রোটিন এমন একটা পলিমার। আর এর মনোমার হলো অ্যামিনো অ্যাসিড।

চলতি বছর রসায়নে নোবেল পুরস্কার পেয়েছেন ডেভিড বেকার, ডেমিস হাসাবি ও জন জাম্পার

সাধারণভাবে প্রাকৃতিক অ্যামিনো অ্যাসিডের সংখ্যা মাত্র ২০। এই ২০টি অ্যামিনো অ্যাসিড একের পর এক যুক্ত হয়ে নানা ধরনের প্রোটিন তৈরি করে। এই অ্যামিনো অ্যাসিডকে তুলনা করা যেতে পারে যেকোনো ভাষার বর্ণমালার সঙ্গে। বাংলা বর্ণমালা যেমন ৫০টি, এই ৫০টি বর্ণ পরপর সাজিয়ে আপনি কবিতা লিখতে পারেন, চিঠি লিখতে পারেন অথবা বিজ্ঞানবিষয়ক লেখা লিখতে পারেন এই নিবন্ধের মতো। অ্যামিনো অ্যাসিডও তেমনি। একেকভাবে সাজালে একেকটা প্রোটিন হয়, সংখ্যায় কমবেশি করে আলাদা আলাদা প্রোটিন বানানো যায়।

একেকটা প্রোটিনের কাজ একেক রকম। যেমন হিমোগ্লোবিন নামে প্রোটিন ফুসফুস থেকে অক্সিজেন নিয়ে শরীরের নানা কোষে পৌঁছে দেয়। চোখের মধ্যে রডোপসিন নামের প্রোটিন আছে বলে আমরা আলাদা আলাদা রং দেখতে পাই। কোনো ভাইরাসে আমাদের শরীর আক্রান্ত হলে যে অ্যান্টিবডি তৈরি হয়, তা–ও আসলে প্রোটিন। জীবজগতের সব কাজেই কোনো না কোনোভাবে প্রোটিনের দরকার হয়।

রসায়নবিদেরা উনিশ শতক থেকেই জানতেন, প্রোটিন খুব গুরুত্বপূর্ণ অণু। কিন্তু প্রোটিনের গঠন জানা গেছে গত শতাব্দীর মাঝামাঝি, যখন এক্স–রে ক্রিস্টালোগ্রাফি আবিষ্কৃত হয়েছে। জন কেন্ড্রু ও ম্যাক্স পেরুৎজ এক্স–রে ক্রিস্টালোগ্রাফি দিয়ে প্রোটিনের ত্রিমাত্রিক গঠন বের করেন। তাঁরা এই কাজের জন্য ১৯৬২ সালে নোবেল পান। এরপর প্রায় ৬৫ বছর পেরিয়েছে। এই সময়ে প্রায় দুই লাখ প্রোটিনের ত্রিমাত্রিক গঠন বের করেছেন বিজ্ঞানীরা। এক্স–রে ক্রিস্টালোগ্রাফি এই সময়ে অনেক উন্নতি করেছে, তবু একেকটা প্রোটিনের গঠন বের করা একেকটা যজ্ঞ। অনেক প্রোটিনের একটা ত্রিমাত্রিক গঠন বের করতে একাধিক পিএইচডি গবেষণার দরকার পড়ে।

প্রোটিনের ত্রিমাত্রিক গঠন বের করার তুলনায় অ্যামিনো অ্যাসিডের সিকোয়েন্স বের করা খানিকটা সোজা। এ জন্য ২০ কোটি প্রোটিনের সিকোয়েন্স করা হয়েছে এই পর্যন্ত।

১৯৬১ সালে আরেকটা ব্রেকথ্রু হয় প্রোটিনের গঠনে। মার্কিন বিজ্ঞানী ক্রিশ্চিয়ান আনফিনসেন আবিষ্কার করেন, কোনো একটা প্রোটিনের ত্রিমাত্রিক গঠন আনফোল্ড করে যদি আবার ফোল্ড হতে দেওয়া হয়, তাহলে ঠিক আগের গঠনেই ফিরে যায়। অর্থাৎ প্রোটিনের ত্রিমাত্রিক গঠন নির্ভর করে শুধু অ্যামিনো অ্যাসিডের সিকোয়েন্সের ওপর। এই কাজের জন্য আনফিনসেন নোবেল পুরস্কার জেতেন ১৯৭২ সালে।

অন্যদিকে ১৯৬৯ সালে সাইরাস লেভিনথাল হিসেব করে দেখান, মাত্র ১০০ অ্যামিনো অ্যাসিড দিয়ে বানানো একটা প্রোটিনের ত্রিমাত্রিক গঠন হতে পারে ১০৪৭ রকম। অর্থাৎ ১ এর পরে ৪৭টা শূন্য। সংখ্যাটা অকল্পনীয় বড়। মহাবিশ্ব সৃষ্টির পর থেকে একটা প্রোটিন র‍্যান্ডমলি গঠন শুরু করলেও এত দিনে শেষ হওয়ার কথা নয়। অথচ একটা কোষের মধ্যে একটা প্রোটিন ফোল্ড করে ত্রিমাত্রিক গঠন পেতে মিলিসেকেন্ড সময় লাগে। প্রশ্ন হলো, একটা প্রোটিন ঠিকঠাক কীভাবে একটা গঠনই পায়?

বিজ্ঞানী আনফিনসেন ও লেভিনথালের আবিষ্কার থেকে বোঝা যায়, প্রোটিনের ত্রিমাত্রিক গঠন একটা নির্ধারিত প্রক্রিয়া। প্রোটিনের সিকোয়েন্সই নির্ধারণ করে দেয় গঠন কী হবে। এর পর থেকে বিজ্ঞানীরা বোঝার চেষ্টা করছেন, প্রোটিনের ত্রিমাত্রিক গঠনের মূল সূত্র কী।

ধারণা করা হয়, পৃথিবীতে পাঁচ হাজার কোটি ভিন্ন ভিন্ন প্রোটিন আছে। মহাবিশ্বে মোট প্রোটিনের সংখ্যা এমনকি লাখ কোটিও ছাড়াতে পারে। ২০ কোটি প্রোটিনের সিকোয়েন্স তাই সব প্রোটিনের তুলনায় অতি সামান্য। দুই লাখ প্রোটিনের গঠন জানা তো সাগর থেকে এক গ্লাস পানি তোলার মতো। এ জন্য রসায়নবিদেরা গত অর্ধশতাব্দী ধরে এমন কোনো তত্ত্ব খুঁজছেন, যা প্রোটিনের সিকোয়েন্স থেকে গঠন অনুমান করতে পারবে। এই সময়ে প্রাণরসায়নের প্রধানতম সমস্যা হিসেবে বিবেচিত হয় প্রোটিনের গঠন অনুমান করা।

এই সমস্যার সমাধান ত্বরান্বিত করার জন্য ১৯৯৪ সালে শুরু হয় ক্রিটিক্যাল অ্যাসেসমেন্ট অব প্রোটিন স্ট্রাকচার প্রেডিকশন বা কাস্প (CASP) প্রতিযোগিতা। এই প্রতিযোগিতা অনুষ্ঠিত হয় প্রতি দুই বছর অন্তর। একটা নির্দিষ্ট সময় দিয়ে উন্মুক্ত করা হয় কতগুলো প্রোটিনের অ্যামিনো অ্যাসিডের সিকোয়েন্স, ওই সিকোয়েন্স থেকে প্রোটিনগুলোর ত্রিমাত্রিক গঠন অনুমান করাই মূলত চ্যালেঞ্জ।

১৯৯৪ থেকে ২০১৬, প্রথম বারো কাস্প প্রতিযোগিতায় গঠন অনুমানের সাফল্য আশানুরূপ ছিল না। সারা বিশ্বের শ্রেষ্ঠ রসায়নবিদেরা চেষ্টা করেছেন, কিন্তু প্রতিবারই দেখা গেছে সেরা অনুমানও মাত্র ৩০ থেকে ৪০ শতাংশ গঠন মেলাতে পেরেছে। ২০১৮ সালে এই চিত্র পাল্টে যায়, ডিপমাইন্ডের কৃত্রিম বুদ্ধিমত্তার মডেল আলফাফোল্ড (AlphaFold) প্রায় ৬০ শতাংশ গঠন অনুমান করতে সক্ষম হয়। আর ২০২০ সালে আলফাফোল্ডের উন্নত ভার্সন আলফাফোল্ড২ প্রায় ৯০ শতাংশ গঠন অনুমান করতে সক্ষম হয়। এভাবেই সমাধান হয় প্রোটিনের ত্রিমাত্রিক গঠন অনুমানের সমস্যা, কৃত্রিম বুদ্ধিমত্তার সহায়তায়। এই কাজে নেতৃত্ব দেন ডেমিস হাসাবি ও জন জাম্পার।

তাঁদের মধ্যে ডেমিস হাসাবি যে বড় কাজ করবেন, তা বোঝা গেছে একদম ছোটবেলাতেই। তিনি প্রথম প্রতিভা দেখিয়েছেন দাবায়, মাত্র চার বছর বয়স থেকেই। ১৩ বছরে তিনি মাস্টার টাইটেল অর্জন করেন। তখন তাঁর ইলো রেটিং ছিল ২৩০০। লম্বা সময় তিনি স্কুলে না গিয়ে বাসাতেই পড়াশোনা করেছেন। এ সময় তিনি পরিচিত হন কম্পিউটার প্রোগ্রামিংয়ের সঙ্গে। বই পড়ে নিজে নিজেই শেখেন প্রোগ্রামিং। আগ্রহ থেকে শুরু করেন কম্পিউটার গেম তৈরি। কেমব্রিজ বিশ্ববিদ্যালয় থেকে স্নাতক শেষ করেন ১৯৯৭ সালে। এরপর অনেক দিন নানা কোম্পানিতে বেশ কয়েকটা জনপ্রিয় কম্পিউটার গেম ডিজাইনে যুক্ত ছিলেন। একসময় তাঁর আগ্রহ তৈরি হয় নিউরোসায়েন্সে। নিউরোসায়েন্সের জ্ঞান ব্যবহার করে কৃত্রিম বুদ্ধিমত্তা তৈরির গবেষণায় যুক্ত হন। পিএইচডি ডিগ্রি অর্জন করেন ২০০৯ সালে, ইউনিভার্সিটি কলেজ লন্ডন থেকে। এরপর কিছুদিন পোস্টডক করেন। পোস্টডকের সময় পরিচয় হওয়া শেইন লেগ এবং পারিবারিক বন্ধু মুস্তাফা সুলায়মানকে নিয়ে ২০১০ সালে গড়ে তোলেন কৃত্রিম বুদ্ধিমত্তার কোম্পানি ডিপমাইন্ড। এতক্ষণে আমরা জানি, এই ডিপমাইন্ড থেকেই তাঁরা তৈরি করেছেন আলফাফোল্ড।

২০১৪ সালে ডিপমাইন্ড বিক্রি হয় গুগলের কাছে। ২০১৬ সালে তাঁরা বিশ্বব্যাপী আলোচনায় আসেন বোর্ডগেম গো খেলায় বিশ্ব চ্যাম্পিয়নকে হারানো কৃত্রিম বুদ্ধিমত্তার প্রোগ্রাম আলফা গো বানিয়ে। আলফা গোর পরবর্তী ভার্সন দাবা খেলার সবচেয়ে শক্তিশালী ইঞ্জিনকে হারিয়ে আলোচনায় এসেছিল। তবে ডেমিস হাসাবির জন্য গো খেলার ইঞ্জিন বানানো ছিল মূল লক্ষ্যে পৌঁছানোর জন্য একটা ধাপমাত্র।

মানবজাতির জন্য গুরুত্বপূর্ণ প্রোটিনের ত্রিমাত্রিক গঠন অনুমান করার জন্য তাঁরা প্রস্তুত হন। হাসাবির দল ঠিক করে, ২০১৮ সালের কাস্প প্রতিযোগিতায় নাম লেখাবে, এ জন্য তৈরি করে আলফাফোল্ড। অংশ নেয় ২০১৮ সালের কাস্প প্রতিযোগিতায়। আগেই আমরা জেনেছি, আগের ৪০ শতাংশ অনুমানের রেকর্ড ভেঙে সে বছর তাঁরা কাস্প প্রতিযোগিতায় ৬০ শতাংশ গঠন অনুমান করতে সক্ষম হন। তবে কাস্প প্রতিযোগিতার জন্য আগে থেকেই ধরে নেওয়া হয়, কেউ যদি ৯০ শতাংশ প্রোটিনের গঠন অনুমান করতে পারে, তবেই শুধু বলা যাবে যে এক্স–রে ক্রিস্টালোগ্রাফি, এনএমআরের মতো যন্ত্রের মাধ্যমে পরীক্ষাগারে নির্ধারণ করা গঠনের সমকক্ষ দক্ষতা অর্জন করেছে সেই তত্ত্ব। ডেমিস হাসাবি এবং ডিপমাইন্ডের জন্য সেটাই ছিল চ্যালেঞ্জ, ৬০ শতাংশ থেকে ৯০ শতাংশে নিয়ে যাওয়া।

৬০ থেকে ৯০ শতাংশে নিতে হাসাবির দল অনেক চেষ্টা করল। কিছুদিনের মধ্যেই বুঝতে পারল, তাদের পদ্ধতিতে এর চেয়ে সফলতার সুযোগ নেই। এই পদ্ধতির সর্বোচ্চ সক্ষমতা তারা অর্জন করে ফেলেছে। ব্রেকথ্রুর জন্য দরকার ভিন্ন কিছু। এই ভিন্ন কিছু নিয়েই তাঁদের সঙ্গে যোগ দিলেন জন এম জাম্পার।

২০১৭ সালে পিএইচডি করার আগে জাম্পার পড়াশোনা করেছেন পদার্থবিজ্ঞান ও গণিতে। ২০১১ সালে প্রোটিন ডায়নামিকস সিমুলেশনের কাজ শুরু করেন তাঁর পিএইচডির জন্য। তখন কম্পিউটার ক্যাপাসিটির ঘাটতি ছিল ইউনিভার্সিটি অব শিকাগোতে। ঘাটতি মেটাতে তিনি বিভিন্ন বুদ্ধি বের করেন, কীভাবে অল্প কম্পিউটিং পাওয়ার দিয়ে প্রোটিন সিমুলেট করা যায়।। এসব করতে গিয়েই তিনি অসামান্য দক্ষতা অর্জন করেন। এর মধ্যে পিএইচডি শেষ করে জানতে পারেন, ডিপমাইন্ড গোপনে প্রোটিনের ত্রিমাত্রিক গঠন নিয়ে কাজ করছে। স্বাভাবিকভাবেই তিনি আগ্রহী হয়ে ওঠেন। চাকরির আবেদন করেন ডিপমাইন্ডে, চাকরিটা হয়ে যায়। ডিপমাইন্ড জহুরি চিনতে ভুল করেনি। দ্রুতই তিনি প্রমোশন পান। জাম্পার ও হাসাবির নেতৃত্বে গড়ে ওঠে পরবর্তী প্রোটিনের গঠন অনুমানের মডেল।

জন জাম্পারের প্রোটিন সিমুলেশনের জ্ঞানের সঙ্গে নতুন করে যুক্ত হয় ট্রান্সফরমারস নামক নিউরাল নেটওয়ার্ক মডেল। এই মডেল ব্যবহার করে সহজেই বড় ডেটাসেট থেকে প্যাটার্ন খুঁজে বের করা যায়। ডিপমাইন্ডের গবেষকেরা তৈরি করেন আলফাফোল্ড২। ২০২০ সালের কাস্প প্রতিযোগিতার সময় দেখা যায়, আলফাফোল্ড২ প্রায় সব প্রোটিনের গঠন ঠিক ঠিক অনুমান করতে পারছে। সেবারও ডিপমাইন্ড সেরা হয় কাস্প প্রতিযোগিতায়, এবার প্রায় ৯০ শতাংশ গঠন অনুমান করতে সক্ষম হয়।

এবার সংক্ষেপে দেখে নেওয়া যাক, আলফাফোল্ড২ কীভাবে কাজ করে। কোনো প্রোটিন সিকোয়েন্স আলফাফোল্ড২ পেলে প্রথমেই দুই লাখ জানা প্রোটিনের গঠনের ডেটাবেজ সার্চ করে। ডেটাবেজের মধ্যে একই ধরনের যেসব প্রোটিন আছে, সেগুলো বের করে আনে। মিল পাওয়া প্রোটিনগুলোর মধ্যে কোন অংশের সিকোয়েন্স মিলে যায়, তা বের করে। সে অংশটুকু গঠন অনুমানে সহায়তা করে। এরপর এই মডেল দেখে প্রোটিনটার কোনো অ্যামিনো অ্যাসিড সিকোয়েন্সের অন্য কোনো অ্যামিনো অ্যাসিডের সঙ্গে আকর্ষণ বা বিকর্ষণ করবে। যেমন কোনো অ্যামিনো অ্যাসিডে যদি ধনাত্মক চার্জ থাকে, তা খুঁজবে একটা ঋণাত্মক অ্যাসিড। পানিকে বিকর্ষণ করে, এমন অ্যামিনো অ্যাসিড খুঁজবে সমধর্মী আরেকটা অ্যামিনো অ্যাসিড। এভাবে আলফাফোল্ড২ একটা দূরত্বের ম্যাপ তৈরি করে, কোন অ্যামিনো অ্যাসিডের সঙ্গে কোন অ্যামিনো অ্যাসিডের মিথস্ক্রিয়ার সম্ভাবনা বেশি। দূরত্ব ম্যাপ ব্যবহার করে এরপর আলফাফোল্ড২ একটা গঠন অনুমান করে। এভাবে তিনবার পুনরাবৃত্তি করে পুরো প্রক্রিয়াটা। এরপর কৃত্রিম বুদ্ধিমত্তার মডেল একটা গঠন অনুমান করে ফলাফল দেখায়।

আলফাফোল্ড২ মডেল ব্যবহার করে এখন খুব সহজেই যেকোনো প্রোটিনের গঠন পাওয়া যায়। এই মডেল ব্যবহার করে ২০ কোটি সিকোয়েন্স জানা সব প্রোটিনের গঠন অনুমান করা হয়েছে, এই অনুমান পরীক্ষাগারে বের করা গঠনেরই সমতুল্য। মডেলটি সবার জন্য উন্মুক্ত। alphafold.ebi.ac.uk ঠিকানায় গিয়ে যে কেউ যেকোনো প্রোটিনের গঠন দেখে নিতে পারে। গবেষকেরা বিপুলভাবে এই মডেলের গঠন ব্যবহার করছেন। নোবেল পাওয়ার আগে ১৯০টি দেশ থেকে প্রায় ২০ লাখ মানুষ এই মডেলের প্রোটিন গঠন ব্যবহার করেছেন। ধারণা করা কঠিন নয় যে নোবেল পুরস্কার ঘোষণার পর এই সংখ্যা হু হু করে বাড়বে।

এতক্ষণ আমরা দেখলাম, কীভাবে একটা প্রোটিনের সিকোয়েন্স থেকে গঠন অনুমানের পদ্ধতি আবিষ্কার সম্ভব হলো। এবার দেখা যাক উল্টোটা, কোনো নির্দিষ্ট গঠনের একটা প্রোটিন যদি কেউ বানাতে চায়, তবে কীভাবে তার সিকোয়েন্স প্রেডিক্ট করা যাবে। এবারের রসায়নের নোবেলের বাকি অর্ধেকটা ওই কাজের জন্যই।

বাকি অর্ধেক নোবেল পাওয়া ডেভিড বেকার বিশ্ববিদ্যালয়ে ভর্তি হয়ে আসলে জীববিজ্ঞান বা রসায়নে আগ্রহী ছিলেন না। তিনি হার্ভার্ড বিশ্ববিদ্যালয়ে পড়তে শুরু করেন দর্শন ও সমাজবিজ্ঞান বিষয়ে। কিন্তু এক ক্লাসে মলিকিউলার বায়োলজি অব দ্য সেল বইটা পড়তে গিয়ে তিনি বুঝতে পারেন, তাঁর আসলে জীববিজ্ঞান পড়া উচিত। এরপর একসময় প্রোটিনের গঠন নিয়ে বিপুলভাবে আগ্রহী হয়ে ওঠেন। পরবর্তী সময়ে তিনি শিক্ষকতা শুরু করেন ইউনিভার্সিটি অব ওয়াশিংটনে। সেখানেই তিনিও শুরু করেন প্রাণরসায়নের সবচেয়ে গুরুত্বপূর্ণ সমস্যা সমাধানের চেষ্টা। গত শতাব্দীর শেষে তৈরি করেন রোজেটা (Rosetta) নামের কম্পিউটার প্রোগ্রাম। এই প্রোগ্রামের প্রথম লক্ষ্য ছিল প্রোটিনের গঠন অনুমান করা। রোজেটা কাস্প প্রতিযোগিতায় অংশ নেয় ১৯৯৮ সালে। অন্য অনেক মডেলের তুলনায় এটি বেশ ভালোই করে। রোজেটার সাফল্যে উৎসাহী হয়ে ডেভিড বেকার এবং তাঁর দল নতুন চিন্তা করে। এই প্রোগ্রাম দিয়ে গঠন অনুমান না করে উল্টোটা করা যায় কি না। তাঁরা একটা প্রোটিনের গঠন ইনপুট দেবেন, ফলাফলে রোজেটা অ্যামিনো অ্যাসিডের সিকোয়েন্স অনুমান করবে।

প্রোটিনের গঠন অনুমান যেমন খুব গুরুত্বপূর্ণ, একইভাবে গঠন থেকে সিকোয়েন্স অনুমান করতে পারাও সমান গুরুত্বের। একটা উদহারণ দিলেই বোঝা যাবে। কোনো একটা ভাইরাসকে ধ্বংস করতে একটা নির্দিষ্ট আকৃতির প্রোটিন দরকার। ওই আকৃতি থাকলেই শুধু ভাইরাসের সঙ্গে প্রোটিনটা যুক্ত হতে পারবে, অ্যান্টিবডি যেভাবে কাজ করে। এই নির্দিষ্ট প্রোটিন বানাতে সিকোয়েন্সটা জানা দরকার। সিকোয়েন্স জানা থাকলে একটা প্রোটিন বানানো অসম্ভব কোনো কাজ নয়।

এমন নানা কাজেই নির্দিষ্ট প্রোটিন দরকার। নব্বইয়ের দশক থেকেই তাই বিজ্ঞানীরা কার্যকর প্রোটিন তৈরির চেষ্টা করছিলেন। তবে অধিকাংশ চেষ্টাই ছিল প্রাকৃতিক প্রোটিনকে খানিকটা মডিফাই করে কীভাবে নতুন প্রোটিন বানানো যায়। ডেভিড বেকার তাতে খুব একটা উৎসাহী ছিলেন না। তাঁর লক্ষ্য হয়ে দাঁড়ায় কীভাবে একদম নতুন প্রোটিন ডিজাইন করা যায়।

নতুন প্রোটিন ডিজাইনের জন্য ডেভিড বেকার এবং তাঁর দল একটা প্রোটিন ডিজাইন করে রোজেটায় ইনপুট দিলেন। রোজেটা প্রথমে মানুষের জানা সব প্রোটিনের গঠনের ডেটাবেজ খুঁজে দেখল, ওই প্রোটিনের নানা অংশ কোন প্রোটিনে আছে। এরপর প্রোটিনের বিভিন্ন অংশের সঙ্গে মিথস্ক্রিয়ার সম্ভাবনা অপটিমাইজ করে একটা সিকোয়েন্স অনুমান করল। ডেভিড বেকারের দল রোজেটার অনুমান করা সিকোয়েন্সের প্রোটিন তৈরি করতে পারবে, এমন একটা জেনেটিক কোড বানালেন। ওই জিন প্রবেশ করালেন ব্যাকটেরিয়ার মধ্যে। ওই ব্যাকটেরিয়া প্রোটিনটা তৈরি করলে এক্স–রে ক্রিস্টালোগ্রাফি দিয়ে গঠন নির্ধারণ করলেন। দেখা গেল, প্রোটিনের গঠন ঠিক যেমন প্রোটিন তাঁরা ডিজাইন করেছিলেন।

ওই প্রোটিনের নাম ছিল টপ সেভেন (Top7)। বেকার এই গবেষণা প্রকাশ করেন ২০০৩ সালে। টপ সেভেন প্রোটিন ডিজাইনের জগৎ পুরোপুরি পাল্টে দেয়। ৯৩ অ্যামিনো অ্যাসিডের এই প্রোটিন এর আগে কখনো প্রকৃতিতে ছিল না। এরপর বেকার তাঁর রোজেটা প্রোগ্রামের কোড সব গবেষকের জন্য উন্মুক্ত করে দেন। পৃথিবীর নানা প্রান্তের গবেষকরা এই কম্পিউটার প্রোগ্রামের উন্নতি সাধন করছেন। এরপর নানা গঠনের প্রোটিনের সিকোয়েন্স অনুমান করা হয়েছে। সেগুলো আবার গবেষণাগারে তৈরি করেও দেখা হয়েছে।

প্রায় অর্ধশতাব্দীর চেষ্টা একধরনের পূর্ণতা পেয়েছে ২০২০ সালে, ডিপমাইন্ডের ডেমিস হাসাবি আর জন জাম্পারের হাত ধরে। এখন যেকোনো প্রোটিন সিকোয়েন্স দিলে মুহূর্তের মধ্যে হাজির হচ্ছে গঠন। আলফাফোল্ড২-এর সাফল্যে অনুপ্রাণিত হয়ে ডেভিড বেকার তাঁর রোজেটা প্রোগ্রামে ট্রান্সফরমার এআই মডেল যুক্ত করেছেন। একদিকে যেমন আমরা সিকোয়েন্স থেকে গঠন জানতে পারছি, একইভাবে গঠন থেকে সিকোয়েন্স অনুমান করাও সম্ভব হচ্ছে এই বিজ্ঞানীদের কাজের ফলে।

এই গবেষণা আমাদের সামনে দুইভাবে বিপুল সম্ভাবনা তৈরি করছে। প্রথমটি হলো কৃত্রিম বুদ্ধিমত্তা। দু-তিন দশকেই কৃত্রিম বুদ্ধিমত্তা এই পর্যায়ে পৌঁছেছে, সামনে যে খুব দ্রুতই অসাধারণ সব ঘটনা ঘটবে, তা বলা বাহুল্য। মানবসভ্যতার জন্য কৃত্রিম বুদ্ধিমত্তা আশীর্বাদ হবে, নাকি অভিশাপ, তা নিয়ে অনেকের দুশ্চিন্তা আছে। সে বিতর্কে না গেলেও এআইয়ের শক্তিমত্তা নিয়ে কোনো বিতর্কের সুযোগ এখন আর নেই।

অন্য সম্ভাবনা হলো, হাসাবি-বেকারদের গবেষণা থেকে সরাসরি মানবজাতি কীভাবে উপকৃত হবে। এখন যেহেতু সহজেই একটা প্রোটিন ডিজাইন করা যাচ্ছে, তাই সহজেই অ্যান্টিভাইরাস তৈরি সম্ভব হবে। বিভিন্ন রোগের জন্য টার্গেটেড ওষুধ ডিজাইন করা যাবে। বিভিন্ন ধরনের সেন্সর বা আণবিক মোটর তৈরি সম্ভব। অন্যদিকে সহজেই প্রোটিনের গঠন জানা যাওয়ায় বিভিন্ন জৈবিক প্রক্রিয়া বোঝা সহজ হবে। মানবজীবন আরেকটু সহজ করতে নানাভাবে এই প্রযুক্তি ব্যবহার করা যাবে।

সব মিলিয়ে, রসায়নের নোবেল গেছে কৃত্রিম বুদ্ধিমত্তার ঘরে, একটু অদ্ভুত শোনালেও রসায়নের বিশাল দুটি চ্যালেঞ্জের সমাধানের জন্য ডেভিড বেকার, ডেমিস হাসাবি ও জন জাম্পারের এই নোবেল প্রাপ্যই ছিল। এ জন্য এ বছর রসায়নের নোবেলের ভবিষ্যদ্বাণীর প্রায় সব তালিকায় একদম ওপরেই ছিল এই তিনজনের নাম।

*নিবন্ধটি নোবেল কমিটি ফর কেমিস্ট্রি প্রদত্ত সায়েন্টিফিক ও পপুলার সায়েন্স ব্যাকগ্রাউন্ড অনুসরণে লেখা

লেখক: গবেষক, রসায়ন বিভাগ, ইউনিভার্সিটি অব ওয়াইমিং, যুক্তরাষ্ট্র

সূত্র: নোবেল প্রাইজ ডট অর্গ, উইকিপিডিয়া, নেচার, ডিপমাইন্ড ডট গুগল, সায়েন্স