The Cyber World In Your Hand: ডাটাবেস ও তথ্য আনয়ন ব্যবস্থাসমূহ

Thursday, January 17, 2013

ডাটাবেস ও তথ্য আনয়ন ব্যবস্থাসমূহ

ডাটাবেস ও তথ্য আনয়ন ব্যবস্থাসমূহ

কীভাবে বিপুল পরিমাণ স্থায়ী ও অংশীদারযোগ্য উপাত্ত সুবিন্যস্ত করা যায়, যাতে এগুলো দক্ষভাবে ব্যবহার করা যায় ও হালনাগাদ করা যায়, তা-ই এই শাখার আলোচ্য। ডাটাবেস (database) হচ্ছে একাধিক রেকর্ডের সমষ্টি যা বিভিন্ন উপায়ে অনুসন্ধান ও হালনাগাদ করা যায়।

তথ্য আনয়ন ব্যবস্থা (information retrieval system) বলতে এক ধরনের ডকুমেন্ট-সমষ্টিকে বোঝায় যে ডকুমেন্টগুলো পরিষ্কারভাবে বিন্যস্ত নয়,অথচ এগুলো থেকে বিভিন্ন ধরনের তথ্য বা উপাত্ত অনুসন্ধান করা প্রয়োজন,যেমন - কোন সংবাদপত্রে প্রকাশিত বহু নিবন্ধের সমষ্টি। কম্পিউটার বিজ্ঞানীরা এই ডকুমেন্টগুলো থেকে উপাত্তের নির্ঘণ্ট (index) বের করার অ্যালগোরিদম রচনা করেন। নির্ঘণ্ট রচনার পর এগুলো থেকে সহজে উপাত্ত ও তথ্য আনয়নের জন্য বিভিন্ন ধরনের কৌশল প্রয়োগ করা হয়। তথ্য আনয়ন ব্যাবস্থার সাথে সম্পর্কিত আরেকটি ক্ষেত্র হচ্ছে উপাত্ত খনন (data mining), যেখানে বিপুল পরিমাণ উপাত্তের মধ্য থেকে বিভিন্ন বিন্যাস (pattern) শনাক্ত করার উপায়গুলো বের করা হয়; এই শনাক্তকৃত বিন্যাসগুলো পরবর্তীকালে সংশ্লিষ্ট ক্ষেত্রে নানা সিদ্ধান্ত গ্রহণে সাহায্য করে।

ডাটাবেস ও আনয়ন ব্যবস্থাসমূহের গবেষণায় যে সমস্ত তত্ত্ব প্রয়োগ করা হয়, তাদের মধ্যে আছে সাম্পর্কিক বীজগণিত (relational algebra), সাম্পর্কিক ক্যালকুলাস (relational calculus), সহবর্তমানতা তত্ত্ব (concurrency theory), ক্রমায়নযোগ্য আদান-প্রদান (serialiable transaction), ডেডলক প্রতিরোধ (deadlock prevention), সময়-সামঞ্জস্যীকৃত হালনাগাদ (synchronized update), নিয়ম-ভিত্তিক সিদ্ধান্তগ্রহণ (rule-based inference), বিন্যস্তকরণ (sorting), অনুসন্ধান (searching), নির্ঘণ্ট তৈরিকরণ (indexing), কর্মদক্ষতা বিশ্লেষণ (performance analysis), তথ্যের গোপনীয়তা (information privacy) ও তথ্য ব্যবহারকারীর পরিচয় যাচাইকরণ (authentication)।

উপাত্তের যৌক্তিক গঠন ও বিভিন্ন উপাত্ত উপাদানের মধ্যে সম্পর্ক বোঝার জন্য বিভিন্ন উপাত্ত মডেল ব্যবহার করা হয়, যেমন - বস্তুভিত্তিক, রেকর্ডভিত্তিক ও বস্তু-সাম্পর্কিক।

No comments:

Post a Comment

Subscribe to: Post Comments (Atom)