Saturday, December 15, 2012




يستخدم الملايين من العرب شبكة تويتر لأهداف كثيرة، ما يجعلها بيئة ثرية للبحث عما يجري في العالم العربي وللتواصل مع من يشاركونك الاهتمامات، لكن نظرا لطبيعة اللغة العربية ومحدودية أداة البحث في تويتر، يجد المستخدمون العرب تحديات في البحث الشامل وفي استخدام الوسوم (الهاشتاقات) للوصول إلى جمهورهم بشكل فعال.

فأداة البحث التي توفرها تويتر على موقعها لا تبحث إلا عن التطابق التام في الكلمات، مما يعني أن على الباحث أن يختبر الطرق المختلفة لإملاء الكلمات. وتعود الاختلافات في الإملاء إلى عوامل مثل الهمزة والتاء المربوطة وأل التعريف والألف المقصورة والتشكيل والسوابق واللواحق (انظر "نصائح للبحث في تويتر" أدناه).

فكلمة "الإمارات" مثلا تكتب بهمزة وبدون همزة ولديها وسمان (#الإمارات، #الامارات). هناك ثلاثة وسوم لكلمة غوغل (#غوغل، #قوقل، #جوجل)، وهناك وسمان للصحة (#صحة، #الصحة)، ويمكن إيجاد "آيفون" بتسعة طرق للإملاء على الأقل: ايفون، آيفون، أيفون، الايفون، الآيفون، الآيفون، اي_فون، أي_فون، الاي_فون. وكذلك الحال بالنسبة لـ"آيباد" و"آندرويد" و"آبل".

فما هي أفضل طريقة للإملاء على تويتر: الطريقة الأكثر تداولا أم الأصح لغويا؟ وما هو الوسم الأفضل استخداما؟

بعض المغردين مثل أبو فيصل يستخدمون وسوما متعددة للوصول إلى جمهورهم. فمثلا، للتغريد عن آيفون يرى الحل في استخدام ثلاثة وسوم: #ايفون #آيفون #أيفون

 وكثيرا ما يختار المغردون ما يعلمون أنه غير صحيح لغويا من الوسوم، لأن الوصول إلى الجمهور لا يعتمد على ما هو الصحيح، بل على ما هو أكثر استخداما.

ويستخدم سليمان اللحيدان الوسم الأكثر شهرة لكنه يحاول التنبيه إلى الصحيح.
ويفعل نواف البيضاني الشيء نفسه باستخدام الخاطئ وإضافة الوسم الصحيح.

ويقول البيضاني إن على المستخدمين العرب التواصل مع إدارة تويتر لحل إشكال الوسوم التي  تختلف بسبب تعدد الإملاءات، وهو برأيه إشكال "ممكن الحل".

من جانبه، يشير المدقق الإملائي @dictation إلى تجربة قام بها باستخدام وسم خاطئ لغويا ونبه إلى الخطأ فبادره صاحب الوسم بالشكر، وأعلن في الوسم نفسه بتغييره إلى الصواب.
ويرى خالد الناصر ضرورة الاتفاق على كتابة واحدة لحرف G في كلمات مثل Instagram (انستغرام، انستقرام، انستجرام).
غير أن بعض المغردين ينزعجون من التدقيق اللغوي ويفضلون العفوية في التغريد. فالمغرد باسم "معلومات لا تهمك" @Uberarabic يشبه المهتمين بتدقيق الأخطاء اللغوية بالمهووسين بالنظافة.

تويتر تعمل على تحسين البحث العربي 

وتقر شركة تويتر بمشكلات البحث في اللغة العربية وتقول إنها تعمل على معالجتها. وتقول المتحدثة باسم تويتر كريستينا ثيري إن "التعقيد في الإملاء في اللغات التي تكتب من اليمين إلى اليسار، ولا سيما اللغة العربية، يشكل تحديا كبيرا في تقديم خدمات بحث وخبرة استكشاف عالية الجودة للمستخدمين". وتضيف ثيري لموقع "راديو سوا" أن الاتصال على الإنترنت في اللغة العربية، وبالأخص التغريد على تويتر، "يكون ببنية غير منتظمة للكلمات، وتهجئات مختلفة مما يؤدي إلى طرق غير معيارية لاستخدام اللغة. وهذا ما يسبب التشتت (أن تكتب الكلمة بطرق مختلفة)".

ولمعالجة هذه المشكلة تقول تويتر إن عليها أن تبني أو تتبنى محللا لغويا خاصا باللغة العربية لتحليل النصوص وتطبيعها وإثرائها بدقة عالية. وتقول ثيري: "نسعى جاهدين لتوسيع مواردنا الهندسية وتحسين جودة البحث في تويتر وخصائص الاستكشاف. يمكنك أن تتوقع نتائج أفضل في المستقبل بينما نقوم بتجديد منتجنا".

غير أن مواقع أخرى مستقلة عن تويتر تقوم بالبحث في تويتر بطريقة جيدة، ومنها موقع غوغل للبحث في تويتر وموقع twinitor.com. فإذا بحثت بأحدهما عن كلمة "أميركا" سيرجع نتائج بحث بالإملاءات الأخرى التي تكتب بها مثل "اميركا" و"أمريكا" و"امريكا".

مواقع البحث عن الوسوم

ومن التحديات الأخرى التي تواجه المغردين العرب اختيار أفضل الوسوم ومعرفة ما هي الوسوم الأكثر تداولا. ويتيح موقع Trendsmap.com خريطة يمكن أن تستعرض بها الوسوم الأكثر استخداما في منطقة جغرافية معينة، لكنه لا يسمح بالبحث في اللغة العربية عن تلك الوسوم. ويقول جون بارات كبير المطورين في الموقع إن "خاصية البحث محدودة لا باللغة، بل إن الموقع يعرض قائمة منتقاة من بين العدد الكبير جدا من الكلمات التي ترد حول العالم".

أي وسم (هاشتاق) تفضل أن تستخدم؟‎

وفي المقابل، يوفر موقع "هاش تاق (وَسِم) العرب" hashmena.com خدمة ممتازة للبحث عن الوسوم، حيث يعرض الوسوم الأكثر شهرة خلال اليوم أو الأسبوع أو الشهر، كما يتيح لك مقارنة وسمين لمعرفة الأكثر تداولا منهما (مثلا #الإخوان أم #الاخوان). والموقع من تصميم شركة زاركوني السعودية.

ويقول القائمون على الموقع لـ"راديو سوا" إنه يقوم "بشكل آلي كليا ضمن برمجة قمنا بتطويرها بأخذ عينة من التغريدات التي يتم تداولها عبر تويتر باللغة العربية، ويزيد التخصيص ضمن نطاقات جغرافية محددة بحيث يتم التركيز على السعودية ثم الخليج ثم باقي الدول العربية ويتم فهرستها بحيث يتم استخراج (الوسوم) / الهاش تاقات، ومن ثم نقوم بعمل تحليل عن عدد مرات ظهورها خلال الساعة الأخيرة واليوم الماضي وخلال الأسبوع الماضي والشهر الماضي، ثم يتم فهرستها آليا لضمان عدم تكرارها وتمر أخيرا على فلترة قمنا بتطويرها لحجب الكلمات غير المناسبة وعزل الوسوم غير العربية وحتى إن ظهرت ضمن التغريدات العربية وأخيرا يتم عرض العربية ضمن الموقع وإرسال النشط منها آليا عبر حساب تويتر المرتبط بالموقع".

كما يقوم الموقع بالبحث عن أكثر التغريدات التي تم تناولها مثل عمل إعادة نشر (ريتويت) وتفضيل (فيفورت) لها بحيث يتم اختيار أكثر 100 تغريدة تم تداولها خلال اليوم.

ويوفر الموقع خدمة عامة مجانية وخدمة الحلول المدفوعة التي تتيح إمكانيات بحث متقدم مثل البحث في مناطق جغرافية معينة.

نصائح للبحث في تويتر

فيما يلي أهم الأمور التي تسبب اختلافات في طرق إملاء الكلمات على تويتر، وتجريب هذه الاحتمالات المختلفة قد يجعل البحث أكثر شمولا:

  1. الانتباه إلى الاختلافات في كتابة الهمزة. فإذا أردت بحثا شاملا عن "آندرويد"، عليك البحث أيضا عن "اندرويد" و"أندرويد".
  2. الانتباه إلى الاختلافات في طريقة كتابة الياء والألف المقصورة، فالمصريون كثيرا ما يكتبون الياء ألفاً مقصورة، والعكس. مثلا "مرسي" يكتب أحيانا "مرسى"، و"مستشفى" قد تجدها مكتوبة "مستشفي". والبحث الشامل يستلزم تجريب كل هذه الاحتمالات.
  3. التاء المربوطة تكتب أحيانا هاء، مثلا "فاطمة" تكتب "فاطمه"، و"مدرسة" تكتب "مدرسه".
  4. التشكيل: إذا بحثت عن كلمة وكانت مشكّلة في تويتر فلن تجدها لأن تويتر لا يبحث إلا عن التطابق التام. مثلا إذا بحثت عن "عمان" فلن تجد "عُمان"، وكذلك الحال بالنسبة لـ"عمّان".
  5. أل التعريف: إذا بحثت عن "تكنولوجيا" فلن تجد "التكنولوجيا" لأن تويتر يبحث عن التطابق التام في الكلمات.
  6. المفرد والجمع: إذا بحثت عن "معارضة" فلن تجد "معارضون" أو "معارضين".
  7. السوابق واللواحق: إذا بحثت عن "صحة" فلن تجد "صحتك" أو "بصحتك".
  8. واو العطف: واو العطف تكون غالبا متصلة بالمعطوف، فإذا بحثت عن "الفرات" فلن تجدها إذا كانت التغريدة تقول "دجلة والفرات" والعكس بالعكس.
  9. ترجمة الكلمات الأجنبية التي تحوي حرف G تختلف من بلد إلى آخر، مثلا غوغل تكتب بثلاثة طرق (غوغل، قوقل، جوجل)، وكذلك الحال بالنسبة لإنستغرام (إنستقرام، إنستغرام، إنستجرام).
  10.  الاختلاف في مدارس كتابة الهمزة بين البلاد العربية، مثلا: "مسئول" و"شئون" و"يقرؤون" في مصر، "مسؤول" و"شؤون" و"يقرأون" في بلاد الشام


Read more: http://www.alhurra.com/content/twitter-arabic-language-search-spelling/216434.html#ixzz2F8Awp7Uu

No comments:

Post a Comment