ডাটাবেস ও তথ্য আনয়ন ব্যবস্থাসমূহ
কীভাবে
বিপুল পরিমাণ স্থায়ী ও অংশীদারযোগ্য উপাত্ত সুবিন্যস্ত করা যায়, যাতে
এগুলো দক্ষভাবে ব্যবহার করা যায় ও হালনাগাদ করা যায়, তা-ই এই শাখার
আলোচ্য। ডাটাবেস (database) হচ্ছে একাধিক রেকর্ডের সমষ্টি যা বিভিন্ন
উপায়ে অনুসন্ধান ও হালনাগাদ করা যায়।
তথ্য আনয়ন ব্যবস্থা
(information retrieval system) বলতে এক ধরনের ডকুমেন্ট-সমষ্টিকে বোঝায় যে
ডকুমেন্টগুলো পরিষ্কারভাবে বিন্যস্ত নয়,অথচ এগুলো থেকে বিভিন্ন ধরনের
তথ্য বা উপাত্ত অনুসন্ধান করা প্রয়োজন,যেমন - কোন সংবাদপত্রে প্রকাশিত বহু
নিবন্ধের সমষ্টি। কম্পিউটার বিজ্ঞানীরা এই ডকুমেন্টগুলো থেকে উপাত্তের
নির্ঘণ্ট (index) বের করার অ্যালগোরিদম রচনা করেন। নির্ঘণ্ট রচনার পর এগুলো
থেকে সহজে উপাত্ত ও তথ্য আনয়নের জন্য বিভিন্ন ধরনের কৌশল প্রয়োগ করা
হয়। তথ্য আনয়ন ব্যাবস্থার সাথে সম্পর্কিত আরেকটি ক্ষেত্র হচ্ছে উপাত্ত
খনন (data mining), যেখানে বিপুল পরিমাণ উপাত্তের মধ্য থেকে বিভিন্ন
বিন্যাস (pattern) শনাক্ত করার উপায়গুলো বের করা হয়; এই শনাক্তকৃত
বিন্যাসগুলো পরবর্তীকালে সংশ্লিষ্ট ক্ষেত্রে নানা সিদ্ধান্ত গ্রহণে সাহায্য
করে।
ডাটাবেস ও আনয়ন ব্যবস্থাসমূহের গবেষণায় যে সমস্ত তত্ত্ব
প্রয়োগ করা হয়, তাদের মধ্যে আছে সাম্পর্কিক বীজগণিত (relational
algebra), সাম্পর্কিক ক্যালকুলাস (relational calculus), সহবর্তমানতা
তত্ত্ব (concurrency theory), ক্রমায়নযোগ্য আদান-প্রদান (serialiable
transaction), ডেডলক প্রতিরোধ (deadlock prevention), সময়-সামঞ্জস্যীকৃত
হালনাগাদ (synchronized update), নিয়ম-ভিত্তিক সিদ্ধান্তগ্রহণ (rule-based
inference), বিন্যস্তকরণ (sorting), অনুসন্ধান (searching), নির্ঘণ্ট
তৈরিকরণ (indexing), কর্মদক্ষতা বিশ্লেষণ (performance analysis), তথ্যের
গোপনীয়তা (information privacy) ও তথ্য ব্যবহারকারীর পরিচয় যাচাইকরণ
(authentication)।
উপাত্তের যৌক্তিক গঠন ও বিভিন্ন উপাত্ত উপাদানের
মধ্যে সম্পর্ক বোঝার জন্য বিভিন্ন উপাত্ত মডেল ব্যবহার করা হয়, যেমন -
বস্তুভিত্তিক, রেকর্ডভিত্তিক ও বস্তু-সাম্পর্কিক।
No comments:
Post a Comment