Friday, April 19, 2013

পিপীলিকা বাংলাদেশের প্রথম এবং একমাত্র সার্চ ইঞ্জিন


পিপীলিকা বাংলাদেশের প্রথম এবং একমাত্র সার্চ ইঞ্জিন যা বাংলা ও ইংরেজী দুই ভাষাতেই কাজ করতে সক্ষম। এই উন্মুক্ত ওয়েব সার্ভিসটি সারা দেশের সাম্প্রতিক গ্রহণসাধ্য তথ্য অনুসন্ধান করতে সহায়তা করে। এটি দেশের প্রধান বাংলা ও ইংরেজী পত্রিকার সংবাদ, বাংলা ব্লগ, বাংলা উইকিপিডিয়া ও সরকারি তথ্য স্বয়ংক্রিয়ভাবে বিশ্লেষণ ও সংরক্ষণ করে। জনপ্রিয় সার্চ ইঞ্জিনগুলোর কোনটিতেই বাংলা ভাষার উপর তেমন গুরুত্ব আরোপ করা হয়নি। তাই আমরা বাংলা তথ্য বিশ্লেষণ ও অনুসন্ধানের উপর গুরুত্ব দেয়ার চেষ্টা করেছি।

পিপীলিকায় বেশ কয়েক ধরণের তথ্য অনুসন্ধানের সুবিধা রয়েছে। আমরা সেগুলো সম্পর্কে ধারণা দেয়ার চেষ্টা করছি-
পিপীলিকা তে ৪টি ভিন্ন ধরণের সার্চ সুবিধা রয়েছেঃ
  • সংবাদ অনুসন্ধান
  • ব্লগ অনুসন্ধান
  • বাংলা উইকিপিডিয়া অনুসন্ধান
  • জাতীয় ই-তথ্যকোষ
সাধারণভাবে কেউ সার্চ করলে সংবাদ অনুসন্ধানের ফলাফল দেখানো হয়। সংবাদ ব্যতীত অন্যান্য অনুসন্ধান করতে হলে সার্চ বক্সের নিচে বামদিকে চাহিদা অনুসারে ব্লগ/উইকিপিডিয়া অথবা ই-তথ্যকোষ অনুসন্ধানে ক্লিক করতে হবে।
সংবাদ অনুসন্ধানঃ
পিপীলিকার সংবাদ অনুসন্ধান বিভাগটি আবার কয়েকটি ভাগে বিভক্তঃ
  • সাধারণ সার্চ
  • স্থান ভিত্তিক সার্চ
  • শ্রেণী(ক্যাটাগরী) ভিত্তিক সার্চ
স্থান ভিত্তিক ও ক্যাটাগরী ভিত্তিক সার্চ এখন শুধুমাত্র বাংলার জন্য উন্মুক্ত।
সাধারণ সার্চঃ
সাধারণ সার্চে যে কোন শব্দ/শব্দাবলী দিয়ে সার্চ করলে সেই শব্দের/শব্দাবলীর ভিত্তিতে সার্চ ফলাফল দেখান হয়। যদি কেউ ইংরেজীতে সার্চ করে তবে কোন ক্যাটাগরী অনুযায়ী ফলাফল দেয়া হয় না। সংবাদ সার্চের ফলাফলের পাশাপাশি একই শব্দ/শব্দাবলীর প্রাপ্যতা অনুযায়ী যেকোনো সার্চের ১ম ১০টি ফলাফল দেখান হয়। প্রয়োজনে তার নিচের আরো ফলাফল এই স্থানটিতে ক্লিক করে আরও অনুসন্ধান করা যায়।
পিপীলিকার বাংলা সার্চের জন্য আমাদের নিজস্ব একটি বাংলা অভিধান ব্যবহার করা হয়েছে। যদি ব্যবহারকারী কোন শব্দের ভুল বানান দেন তাহলে আমাদের পিপীলিকা স্বয়ংক্রিয়ভাবে সঠিক বানান খুঁজে নিয়ে সেই নতুন শব্দ দিয়ে অনুসন্ধান চালায়, ফলাফল দেয় এবং সাথে সাথে ব্যবহারকারীকে জানিয়ে দেয় তার কোন শব্দের বানান ভুল ছিল এবং সঠিক কোন শব্দ দিয়ে অনুসন্ধান চালানো হয়েছে। ব্যবহারকারী চাইলে পরে সেই ভুল শব্দ দিয়েই আবার অনুসন্ধান চালাতে পারেন। ইংরেজী সার্চের ক্ষেত্রে অভিধানটি ব্যবহার করা হয়নি।
ফলাফলে দেখান হবে-
  • মোট অনুসন্ধানের সময়
  • মোট ফলাফলের মাঝে প্রথম কতগুলো ফলাফল দেখান হল
  • প্রতিটি ফলাফলের শিরোনাম (হেডলাইন বা টাইটেল)
  • প্রতিটি ফলাফল থেকে হাইলাইটেড বা চুম্বক অংশ
  • সংবাদটির মূল সোর্সের ওয়েব লিঙ্ক
  • ক্যাশ করা (Cached) সংবাদটি
ব্যবহারকারী মূল ওয়েব লিঙ্ক বা হেডলাইনে ক্লিক করলে সহজেই মূল সংবাদ সোর্সে যেতে পারেন। আবার ক্যাশে(Cached)ক্লিক করলে সে এখানেই এক সাথে সংবাদটির হেডলাইন, সোর্স, মূল সংবাদ, তারিখ ও ওয়েব লিঙ্ক দেখতে পারবেন। এজন্য তার মূল সোর্সে যাওয়ার প্রয়োজন নেই।
স্থান ভিত্তিক সার্চঃ
কোন ব্যবহারকারী যদি সার্চ বক্সে কোন জেলার নাম ইংরেজীতে লেখার চেষ্টা করেন তাহলে পিপীলিকা তাকে স্বয়ংক্রিয়ভাবে বাংলাতে ওই স্থানের নাম সাজেশন হিসেবে দেয়ার চেষ্টা করবে। ব্যবহারকারী যদি শুধুমাত্র স্থানটির নাম দিয়ে অনুসন্ধান করেন তাহলে পিপীলিকা তার ফলাফল প্রকাশের সাধারণ পদ্ধতিটি পরিবর্তন করে একটি বিশেষ পদ্ধতিতে ফলাফল প্রকাশ করবে। সে সেই জেলার সাম্প্রতিক সময়ের তথ্য সমূহ বিশ্লেষণ করে কয়েকটি ক্যাটাগরীতে প্রকাশ করবে (যেমনঃ অপরাধ, ব্যবসা, বিজ্ঞান ও প্রযুক্তি, খেলাধুলা, কৃষি তথ্য ইত্যাদি) প্রতিটি ক্যাটাগরীতে দেখান হবে-
  • ১ম ৫টি ফলাফল
  • মোট ফলাফল সংখ্যা
কোন ব্যবহারকারী আরো ফলাফল স্থানে ক্লিক করে সহজেই ওই জেলার ওই ক্যাটাগরীর বাকি ফলাফলগুলো দেখতে পাবেন। স্থান ভিত্তিক সার্চের সময় অভিধাণ প্রয়োগ করা হয় নি।
ক্যাটাগরী ভিত্তিক সার্চঃ
পিপীলিকায় বর্তমানে ফলাফলের মোট ৬টি ক্যাটাগরী রয়েছেঃ
  • ব্যবসা ও বাণিজ্য
  • তথ্য ও প্রযুক্তি
  • বিনোদন
  • খেলাধূলা
  • ব্লগ
  • বাংলা উইকিপিডিয়া
  • জাতীয় ই-তথ্যকোষ

জাতীয় ই-তথ্যকোষ বাদে বাকি ক্যাটাগরীগুলো বিভিন্ন ধরণের সংবাদ নির্দেশ করে। কোন ব্যবহারকারী যে কোন একটি ক্যাটাগরীতে ক্লিক করলে সে তার সার্চ বক্সে দেয়া শব্দ/শব্দাবলী কেবলমাত্র ওই ক্যাটাগরীর সংবাদসমূহে অনুসন্ধান করতে পারবেন। উল্লেখ্য, সাধারণ সার্চের সময় সকল ক্যাটাগরীর সংবাদের মাঝে অনুসন্ধান চালানো হত। এই সার্চের ক্ষেত্রেও সাধারণ সার্চের মত ফলাফল দেখান হবে।
জাতীয় ই-তথ্যকোষ সম্পূর্ণ ভিন্ন একটি ক্যাটাগরী। এই ক্যাটাগরীতে মূলত জাতীয় ই-তথ্যকোষ/জ্ঞানকোষ (National Infokosh) এর তথ্যসমূহ সরক্ষণের চেষ্টা করা হয়েছে।
যেহেতু পিপীলিকার বর্তমান সংস্করণটি একটি বেটা সংস্করণ সেহেতু এতে কিছু সমস্যা দেখা যেতে পারে। আমরা মূলত মূল ওয়েব লিঙ্কের ভিত্তিতে ক্যাটাগরী করায় অনেক সময় একই হেডলাইনের সংবাদ অনেক বার, অনেক ভাবে আসতে পারে। কিন্তু একটু লক্ষ্য করলেই দেখা যাবে যে প্রতিটি সংবাদের ওয়েব লিঙ্ক ভিন্ন ভিন্ন। উপরে সংক্ষেপে পিপীলিকা সার্চ ইঞ্জিনটির সাধারণ ব্যবহার বিধি দেয়ার চেষ্টা করা হল।

No comments: