সূচিপত্র
১১১.৮ গিগাবিট/সেকেন্ড
থ্রুপুট রেট
৩৭২×
সিপিইউর তুলনায় কর্মদক্ষতা
৬৪৪×
সিপিইউর তুলনায় শক্তি দক্ষতা
২০%
জিপিইউর তুলনায় কর্মদক্ষতা
1. ভূমিকা
ডিজিটাল মুদ্রা, ব্লকচেইন এবং ক্লাউড ডেটা এনক্রিপশনের ক্ষেত্রে, ঐতিহ্যগত সফটওয়্যার-ভিত্তিক এনক্রিপশন এবং ডিক্রিপশন পদ্ধতিগুলি ধীর গণনা গতি, উচ্চ হোস্ট সম্পদ খরচ এবং অত্যধিক বিদ্যুৎ ব্যবহার সহ উল্লেখযোগ্য চ্যালেঞ্জের মুখোমুখি হয়। ভেরিলোগ/ভিএইচডিএল ব্যবহার করে এফপিজিএ-ভিত্তিক বাস্তবায়নগুলি হার্ডওয়্যার এক্সিলারেশন অফার করলেও, এগুলি দীর্ঘ উন্নয়ন চক্র এবং কঠিন রক্ষণাবেক্ষণে ভোগে।
এই গবেষণা ৩ডিইএস অ্যালগরিদমের জন্য একটি উদ্ভাবনী ওপেনসিএল-ভিত্তিক এফপিজিএ এক্সিলারেটর ডিজাইন উপস্থাপন করে যা পাইপলাইন সমান্তরাল আর্কিটেকচার, ডেটা স্টোরেজ সমন্বয়, বিট-প্রস্থ উন্নতি, নির্দেশনা স্ট্রীম অপ্টিমাইজেশন, কার্নেল ভেক্টরাইজেশন এবং কম্পিউট ইউনিট প্রতিলিপিকরণ সহ পরিশীলিত অপ্টিমাইজেশন কৌশলের মাধ্যমে এই সীমাবদ্ধতাগুলি মোকাবেলা করে।
2. ৩ডিইএস অ্যালগরিদমের নীতিমালা
2.1 ডিইএস অ্যালগরিদম
ডিইএস (ডেটা এনক্রিপশন স্ট্যান্ডার্ড) অ্যালগরিদম ১৬ রাউন্ডের ফেইস্টেল নেটওয়ার্ক অপারেশনের মাধ্যমে ৫৬-বিট কী ব্যবহার করে ৬৪-বিট ব্লকে কাজ করে। মূল গাণিতিক অপারেশনটি নিম্নরূপে উপস্থাপন করা যেতে পারে:
$L_i = R_{i-1}$
$R_i = L_{i-1} \oplus f(R_{i-1}, K_i)$
যেখানে $L_i$ এবং $R_i$ ডেটা ব্লকের বাম এবং ডান অর্ধেক প্রতিনিধিত্ব করে, $K_i$ হল রাউন্ড কী, এবং $f$ হল ফেইস্টেল ফাংশন যা সম্প্রসারণ, কী মিক্সিং, প্রতিস্থাপন এবং পরিবর্তন অপারেশন জড়িত।
2.2 ৩ডিইএস অ্যালগরিদম কাঠামো
৩ডিইএস দুটি বা তিনটি ভিন্ন কী সহ ডিইএস তিনবার প্রয়োগ করে নিরাপত্তা বাড়ায়। এনক্রিপশন প্রক্রিয়া নিম্নরূপ:
$C = E_{K3}(D_{K2}(E_{K1}(P)))$
যেখানে $E$ এনক্রিপশন, $D$ ডিক্রিপশন, $P$ প্লেইনটেক্সট, $C$ সাইফারটেক্সট, এবং $K1$, $K2$, $K3$ হল তিনটি ৫৬-বিট কী। এই কাঠামো ১৬৮-বিট কার্যকর কী দৈর্ঘ্য সহ ৪৮ রাউন্ডের এনক্রিপশন প্রদান করে।
3. ওপেনসিএল-ভিত্তিক এফপিজিএ এক্সিলারেটর ডিজাইন
3.1 আর্কিটেকচার ওভারভিউ
প্রস্তাবিত এক্সিলারেটর ৩ডিইএস অ্যালগরিদমের জন্য বিশেষভাবে ডিজাইন করা ৪৮ পুনরাবৃত্তি সহ একটি ব্যাপক পাইপলাইন সমান্তরাল কাঠামো নিয়োগ করে। আর্কিটেকচারটি দুটি প্রধান মডিউল নিয়ে গঠিত: ডেটা ট্রান্সমিশন মডিউল এবং অ্যালগরিদম এনক্রিপশন মডিউল, ইন্টেল স্ট্রাটিক্স ১০ জিএক্স২৮০০ এফপিজিএ-তে সর্বাধিক থ্রুপুটের জন্য অপ্টিমাইজ করা।
3.2 ডেটা ট্রান্সমিশন অপ্টিমাইজেশন
ডেটা ট্রান্সমিশন মডিউল দুটি মূল কৌশল বাস্তবায়ন করে:
- ডেটা স্টোরেজ সমন্বয়: লেটেন্সি কমাতে মেমরি অ্যাক্সেস প্যাটার্ন অপ্টিমাইজ করে
- ডেটা বিট-প্রস্থ উন্নতি: ব্যান্ডউইথ ব্যবহার সর্বাধিক করতে ডেটা পথের প্রস্থ বাড়ায়
এই অপ্টিমাইজেশনগুলি ৮৫% এর বেশি প্রকৃত কার্নেল ব্যান্ডউইথ ব্যবহার অর্জন করে, যা প্রচলিত বাস্তবায়নের তুলনায় উল্লেখযোগ্যভাবে উচ্চতর।
3.3 অ্যালগরিদম এনক্রিপশন মডিউল
এনক্রিপশন মডিউল একটি গভীরভাবে পাইপলাইনযুক্ত সমান্তরাল আর্কিটেকচার তৈরি করতে নির্দেশনা স্ট্রীম অপ্টিমাইজেশন নিয়োগ করে। মূল বৈশিষ্ট্যগুলির মধ্যে রয়েছে:
- ৩ডিইএস রাউন্ডের জন্য ৪৮-স্টেজ পাইপলাইন
- সমান্তরাল কী শিডিউলিং
- অপ্টিমাইজড এস-বক্স বাস্তবায়ন
- রাউন্ডগুলির মধ্যে ন্যূনতম ডেটা নির্ভরতা
3.4 কর্মদক্ষতা বৃদ্ধির কৌশল
অতিরিক্ত কর্মদক্ষতা উন্নতি নিম্নলিখিতের মাধ্যমে অর্জন করা হয়:
- কার্নেল ভেক্টরাইজেশন: সমান্তরাল ডেটা প্রসেসিংয়ের জন্য এসআইএমডি অপারেশন ব্যবহার করা
- কম্পিউট ইউনিট প্রতিলিপিকরণ: বর্ধিত থ্রুপুটের জন্য একাধিক সমান্তরাল কম্পিউট ইউনিট
- মেমরি অ্যাক্সেস অপ্টিমাইজেশন: সম্মিলিত মেমরি অ্যাক্সেস এবং স্থানীয় মেমরি ব্যবহার
4. পরীক্ষামূলক ফলাফল
পরীক্ষামূলক মূল্যায়ন উল্লেখযোগ্য কর্মদক্ষতা অর্জন প্রদর্শন করে:
| প্ল্যাটফর্ম | থ্রুপুট (গিগাবিট/সেকেন্ড) | কর্মদক্ষতা উন্নতি | শক্তি দক্ষতা উন্নতি |
|---|---|---|---|
| ইন্টেল কোর i7-9700 সিপিইউ | ০.৩ | ১× (বেসলাইন) | ১× (বেসলাইন) |
| এনভিডিয়া জিফোর্স জিটিএক্স ১০৮০ টি জিপিইউ | ৯৩.২ | ৩১০× | ৭১× |
| প্রস্তাবিত এফপিজিএ এক্সিলারেটর | ১১১.৮ | ৩৭২× | ৬৪৪× |
এফপিজিএ বাস্তবায়ন ১১১.৮০১ গিগাবিট/সেকেন্ড থ্রুপুট অর্জন করে যখন সিপিইউ এবং জিপিইউ বাস্তবায়ন উভয়ের তুলনায় উল্লেখযোগ্যভাবে কম শক্তি খরচ করে, ক্রিপ্টোগ্রাফিক অ্যাপ্লিকেশনের জন্য উচ্চতর শক্তি দক্ষতা প্রদর্শন করে।
5. প্রযুক্তিগত বিশ্লেষণ
বিশেষজ্ঞ বিশ্লেষণ: চার-ধাপের সমালোচনামূলক মূল্যায়ন
একেবারে মূল বিষয়ে (Cutting to the Chase)
এই গবেষণা ঐতিহ্যগত ক্রিপ্টোগ্রাফিক বাস্তবায়নগুলিকে একটি কঠিন বাস্তবতা চেক প্রদান করে। আধুনিক সিপিইউর তুলনায় ৩৭২x কর্মদক্ষতা উন্নতি কেবল増加的 নয়—এটি স্থাপত্যিক বিঘ্ন। লেখকরা মূলত প্রদর্শন করেছেন যে ৩ডিইএস ওয়ার্কলোডের জন্য, সাধারণ-উদ্দেশ্য প্রসেসরগুলি মৌলিকভাবে অদক্ষ, এবং এমনকি এই নির্দিষ্ট কাজের জন্য জিপিইউগুলিও এফপিজিএর শক্তি দক্ষতার সাথে মেলাতে পারে না।
যুক্তি শৃঙ্খল (Logical Chain)
কর্মদক্ষতা অগ্রগতি একটি স্পষ্ট অপ্টিমাইজেশন শ্রেণিবিন্যাস অনুসরণ করে: প্রথমত, তারা ডেটা স্টোরেজ সমন্বয়ের মাধ্যমে মেমরি ব্যান্ডউইথ ব্যবহার আক্রমণ করেছে (মেমরি প্রাচীর সমস্যা সমাধান)। দ্বিতীয়ত, তারা ৪৮-রাউন্ড ৩ডিইএস কাঠামো ব্যবহার করার জন্য গভীর পাইপলাইনিং বাস্তবায়ন করেছে। তৃতীয়ত, তারা সমান্তরাল প্রসেসিং সর্বাধিক করতে ভেক্টরাইজেশন এবং কম্পিউট ইউনিট প্রতিলিপিকরণ প্রয়োগ করেছে। এই পদ্ধতিগত পদ্ধতি উচ্চ-কর্মদক্ষতা কম্পিউটিং সাহিত্যে দেখা অপ্টিমাইজেশন কৌশলগুলিকে প্রতিফলিত করে, বিশেষ করে বার্কলের এসপিআইআরই প্রকল্পে ব্যবহৃত রুফলাইন মডেল বিশ্লেষণ।
উজ্জ্বল দিক এবং সীমাবদ্ধতা (Highlights and Limitations)
উজ্জ্বল দিক: ৬৪৪x শক্তি দক্ষতা উন্নতি মাত্রাতিরিক্ত এবং ডেটা সেন্টার অপারেশনের জন্য বাস্তব প্রভাব রয়েছে। ঐতিহ্যগত এইচডিএলের পরিবর্তে ওপেনসিএল ব্যবহার এই পদ্ধতিটি সফটওয়্যার ইঞ্জিনিয়ারদের জন্য অ্যাক্সেসযোগ্য করে তোলে। সিপিইউ এবং জিপিইউ উভয়ের সাথে তুলনা ব্যাপক বেঞ্চমার্কিং প্রদান করে।
সীমাবদ্ধতা: কাগজটি একচেটিয়াভাবে ৩ডিইএস-এ ফোকাস করে, যা অনেক অ্যাপ্লিকেশনে এইএস-এর পক্ষে পর্যায়ক্রমে বাদ দেওয়া হচ্ছে। অন্যান্য অ্যালগরিদমে স্কেলযোগ্যতা সম্পর্কে সীমিত আলোচনা রয়েছে। ইন্টেল স্ট্রাটিক্স ১০ জিএক্স২৮০০ একটি উচ্চ-শেষের এফপিজিএ, যা ছোট মোতায়েনের জন্য খরচ-কার্যকারিতা প্রশ্নবিদ্ধ করে।
কার্যকরী অন্তর্দৃষ্টি (Actionable Insights)
ক্লাউড প্রদানকারী এবং আর্থিক প্রতিষ্ঠানগুলির জন্য যারা এখনও ৩ডিইএস ব্যবহার করছে, এই গবেষণা এফপিজিএ এক্সিলারেশনের জন্য একটি স্পষ্ট মাইগ্রেশন পথ প্রদান করে। ওপেনসিএল পদ্ধতিটি ঐতিহ্যগত এফপিজিএ উন্নয়নের তুলনায় প্রবেশের বাধা উল্লেখযোগ্যভাবে কমিয়ে দেয়। সংস্থাগুলির জন্য উচ্চ-ভলিউম লেনদেন প্রসেসিংয়ের জন্য এফপিজিএ-ভিত্তিক ক্রিপ্টোগ্রাফিক এক্সিলারেশন বিবেচনা করা উচিত এবং অন্যান্য সিমেট্রিক এনক্রিপশন অ্যালগরিদম ত্বরান্বিত করার জন্য এই আর্কিটেকচারটিকে একটি টেমপ্লেট হিসাবে বিবেচনা করা উচিত।
মূল বিশ্লেষণ (৪০০ শব্দ)
এই গবেষণা ক্রিপ্টোগ্রাফিক এক্সিলারেশনে একটি উল্লেখযোগ্য অগ্রগতির প্রতিনিধিত্ব করে যা সফটওয়্যার অ্যাক্সেসযোগ্যতা এবং হার্ডওয়্যার কর্মদক্ষতার মধ্যে ব্যবধান পূরণ করে। এফপিজিএ উন্নয়নের জন্য ওপেনসিএল ব্যবহার করে লেখকদের পদ্ধতি উচ্চ-কর্মদক্ষতা কম্পিউটিং-এ একটি সমালোচনামূলক ব্যথার বিন্দু সমাধান করে: হার্ডওয়্যার এক্সিলারেশনের জন্য দক্ষতা বাধা। ক্রোনোস গ্রুপের ওপেনসিএল স্পেসিফিকেশনে উল্লিখিত হিসাবে, এই ফ্রেমওয়ার্কটি "একটি বহনযোগ্য, খোলা মান ব্যবহার করে ভিন্নধর্মী সিস্টেমের সমান্তরাল প্রোগ্রামিং" সক্ষম করে, যা ত্বরিত কম্পিউটিং মূলধারার বিকাশকারীদের জন্য অ্যাক্সেসযোগ্য করে তোলে।
অর্জিত ১১১.৮ গিগাবিট/সেকেন্ড থ্রুপুট ক্রিপ্টোগ্রাফিক ওয়ার্কলোডের জন্য পাইপলাইন সমান্তরাল আর্কিটেকচারের কার্যকারিতা প্রদর্শন করে। এই কর্মদক্ষতা অন্যান্য ডোমেন-নির্দিষ্ট আর্কিটেকচারে পর্যবেক্ষণ করা প্রবণতাগুলির সাথে সামঞ্জস্যপূর্ণ, যেমন গুগলের টিপিইউ নিউরাল নেটওয়ার্কের জন্য বা ইন্টেলের হাবানা ল্যাবস এআই প্রসেসর। এখানে মূল অন্তর্দৃষ্টি হল যে ক্রিপ্টোগ্রাফিক অ্যালগরিদমগুলি, তাদের নিয়মিত কাঠামো এবং নির্ধারিত এক্সিকিউশন প্যাটার্ন সহ, এফপিজিএ এক্সিলারেশনের জন্য বিশেষভাবে উপযুক্ত।
আইইইই ট্রানজেকশনস অন ভিএলএসআই সিস্টেমস-এ নথিভুক্ত ঐতিহ্যগত এইচডিএল-ভিত্তিক পদ্ধতির তুলনায়, ওপেনসিএল বাস্তবায়ন উল্লেখযোগ্য উন্নয়ন দক্ষতার সুবিধা অফার করে। যাইহোক, ইউনিভার্সিটি অফ টরন্টোর এফপিজিএ গ্রুপের গবেষণা থেকে দেখা গেছে, হ্যান্ড-অপ্টিমাইজড আরটিএলের তুলনায় উচ্চ-স্তরের সংশ্লেষণ ব্যবহার করার সময় সাধারণত একটি কর্মদক্ষতা জরিমানা থাকে। এই বাস্তবায়নটি এখনও সিপিইউ এবং জিপিইউ উভয়ের তুলনায় উচ্চতর কর্মদক্ষতা অর্জন করে তা ব্যতিক্রমীভাবে কার্যকর অপ্টিমাইজেশন কৌশলগুলির পরামর্শ দেয়।
শক্তি দক্ষতা ফলাফল (সিপিইউর তুলনায় ৬৪৪x উন্নতি) বিশেষভাবে আকর্ষণীয় given কম্পিউটেশনাল স্থায়িত্বের ক্রমবর্ধমান গুরুত্ব। ডেটা সেন্টারগুলি ক্রমবর্ধমানভাবে বিদ্যুৎ সীমাবদ্ধতার মুখোমুখি হওয়ায়, যেসব পদ্ধতি প্রতি ওয়াটে বিশাল কর্মদক্ষতা সরবরাহ করে সেগুলি অপরিহার্য হয়ে উঠবে। এই গবেষণা প্রদর্শন করে যে ক্রিপ্টোগ্রাফিক অ্যালগরিদমের মতো নির্দিষ্ট কম্পিউটেশনাল প্যাটার্নের জন্য, এফপিজিএগুলি সাধারণ-উদ্দেশ্য আর্কিটেকচারের তুলনায় অর্ডার-অফ-ম্যাগনিটিউড সুবিধা প্রদান করতে পারে।
যাইহোক, ৩ডিইএস-এ ফোকাস দীর্ঘমেয়াদী প্রাসঙ্গিকতা সম্পর্কে প্রশ্ন উত্থাপন করে। এনআইএসটি অনেক অ্যাপ্লিকেশনের জন্য ৩ডিইএস অবমূল্যায়ন করছে এবং এইএস-এ রূপান্তর করছে, আধুনিক ক্রিপ্টোগ্রাফিক মানগুলিতে এই নির্দিষ্ট অপ্টিমাইজেশনগুলির প্রযোজ্যতা আরও তদন্তের দাবি রাখে। যাইহোক, স্থাপত্যিক প্যাটার্ন এবং অপ্টিমাইজেশন কৌশলগুলি সম্ভবত এইএস এবং অন্যান্য সিমেট্রিক এনক্রিপশন অ্যালগরিদমে স্থানান্তরযোগ্য।
6. কোড বাস্তবায়ন
ওপেনসিএল কার্নেল উদাহরণ
__kernel void triple_des_encrypt(
__global const uint8_t *input,
__global uint8_t *output,
__constant uint32_t *key_schedule,
const uint num_blocks)
{
int gid = get_global_id(0);
if (gid >= num_blocks) return;
// লোড ৬৪-বিট ব্লক
uint64_t block = *((__global uint64_t*)(input + gid * 8));
// ৩ডিইএস এনক্রিপশন: E_K3(D_K2(E_K1(P)))
block = des_encrypt(block, key_schedule, 0); // K1 সহ প্রথম ডিইএস
block = des_decrypt(block, key_schedule, 16); // K2 সহ দ্বিতীয় ডিইএস
block = des_encrypt(block, key_schedule, 32); // K3 সহ তৃতীয় ডিইএস
// ফলাফল সংরক্ষণ
*((__global uint64_t*)(output + gid * 8)) = block;
}
uint64_t des_encrypt(uint64_t block, __constant uint32_t *keys, int key_offset)
{
// প্রাথমিক পরিবর্তন
block = initial_permutation(block);
uint32_t left = (uint32_t)(block >> 32);
uint32_t right = (uint32_t)block;
// ১৬ ফেইস্টেল রাউন্ড
#pragma unroll
for (int i = 0; i < 16; i++) {
uint32_t temp = right;
right = left ^ feistel_function(right, keys[key_offset + i]);
left = temp;
}
// চূড়ান্ত পরিবর্তন
return final_permutation(((uint64_t)right << 32) | left);
}
7. ভবিষ্যতের প্রয়োগ
এই গবেষণায় প্রদর্শিত স্থাপত্যিক পদ্ধতির ৩ডিইএস এনক্রিপশনের বাইরে বিস্তৃত প্রযোজ্যতা রয়েছে:
- ব্লকচেইন এবং ক্রিপ্টোকারেন্সি: উচ্চ-ফ্রিকোয়েন্সি ট্রেডিং প্ল্যাটফর্ম এবং মাইনিং অপারেশনগুলি ক্রিপ্টোগ্রাফিক অপারেশনের জন্য অনুরূপ এফপিজিএ এক্সিলারেশন লিভারেজ করতে পারে।
- ৫জি নিরাপত্তা: পাইপলাইন আর্কিটেকচার বেস স্টেশন প্রসেসিং-এ ৫জি এনক্রিপশন মানগুলির জন্য অভিযোজিত হতে পারে।
- এজ কম্পিউটিং: নিম্ন-শক্তি এফপিজিএ বাস্তবায়ন আইওটি ডিভাইস এবং এজ সার্ভারগুলির জন্য ক্রিপ্টোগ্রাফিক এক্সিলারেশন প্রদান করতে পারে।
- পোস্ট-কোয়ান্টাম ক্রিপ্টোগ্রাফি: অপ্টিমাইজেশন কৌশলগুলি উদীয়মান পোস্ট-কোয়ান্টাম ক্রিপ্টোগ্রাফিক অ্যালগরিদমে প্রয়োগ করা যেতে পারে।
- মাল্টি-অ্যালগরিদম এক্সিলারেটর: ভবিষ্যতের কাজ গতিশীলভাবে পুনরায় কনফিগারযোগ্য এফপিজিএ ডিজাইনগুলি অন্বেষণ করতে পারে যা একাধিক এনক্রিপশন অ্যালগরিদম সমর্থন করে।
গবেষণা দিকগুলির মধ্যে রয়েছে এই অপ্টিমাইজেশন কৌশলগুলির প্রয়োগ এইএস-জিসিএম, চাচা২০-পলি১৩০৫ এবং অন্যান্য আধুনিক এনক্রিপশন মানগুলিতে অন্বেষণ করা, সেইসাথে স্বয়ংক্রিয় অপ্টিমাইজেশন টুলগুলি তদন্ত করা যা অনুরূপ রূপান্তরগুলি নির্বিচারে ক্রিপ্টোগ্রাফিক অ্যালগরিদমে প্রয়োগ করতে পারে।
8. তথ্যসূত্র
- কে. গ্রুপ, "দ্য ওপেনসিএল স্পেসিফিকেশন," ক্রোনোস গ্রুপ, ২০২০।
- ন্যাশনাল ইনস্টিটিউট অফ স্ট্যান্ডার্ডস অ্যান্ড টেকনোলজি, "রিকমেন্ডেশন ফর ট্রিপল ডেটা এনক্রিপশন অ্যালগরিদম (টিডিইএ) ব্লক সাইফার," এনআইএসটি এসপি ৮০০-৬৭রেভ২, ২০১৭।
- জে. কং et al., "হাই-লেভেল সিন্থেসিস ফর এফপিজিএস: ফ্রম প্রোটোটাইপিং টু ডিপ্লয়মেন্ট," আইইইই ট্রানজেকশনস অন সিএডি, ২০১১।
- এম. পাপাডোনিকোলাকিস et al., "পারফরম্যান্স কম্প্যারিজন অফ জিপিইউ অ্যান্ড এফপিজিএ আর্কিটেকচারস ফর ক্রিপ্টোগ্রাফি," সামোস, ২০১০।
- এ. এম. et al., "এফপিজিএ-বেসড এক্সিলারেটরস অফ ক্রিপ্টোগ্রাফিক অ্যালগরিদমস," আইইইই ট্রানজেকশনস অন কম্পিউটারস, ২০১৩।
- ইন্টেল কর্পোরেশন, "ইন্টেল এফপিজিএ এসডিকে ফর ওপেনসিএল প্রোগ্রামিং গাইড," ২০২০।
- জিলিন্ক্স, "এসডিএসেল ডেভেলপমেন্ট এনভায়রনমেন্ট ইউজার গাইড," ২০১৯।
- ডব্লিউ. জিয়াং et al., "এ সার্ভে অফ এফপিজিএ-বেসড ক্রিপ্টোগ্রাফিক কম্পিউটিং," এসিএম কম্পিউটিং সার্ভে, ২০২১।