تحلیل نظرات و دیدگاههای منتشر شده در مورد جنبههای مختلف یک محصول یا خدمات یک سازمان در شبکههای اجتماعی و رسانهها از جمله توییتر، اینستاگرام و غیره، یکی از موضوعات مهم و قابل توجه برای بسیاری از شرکتها و سازمانها است. با فراگیر شدن شبکههای اجتماعی و رشد روزافزون حجم محتوای منتشر شده، بررسی و پردازش همه نظرات و دیدگاهها بهصورت دستی برای رسیدن به یک تحلیل جامع و کامل، نیازمند منابع انسانی و صرف زمان زیادی است. این مسأله امروزه با کمک هوش مصنوعی و پردازش زبان طبیعی (NLP) امکانپذیر شده است.
«تحلیل احساسات» یکی از ابتداییترین و کاربردیترین ویژگیهایی است که در پردازش یک متن (نظر) باید به آن رسید؛ که خوشبختانه این مسأله با دقت و سرعت خوبی برای زبان فارسی پیادهسازی و مورد استفاده قرار میگیرد. اما نقطهضعف بزرگی که در این میان وجود دارد این است که تحلیل احساسات یا رضایتمندی بهطور کلی و یا در نهایت به یک جمله محدود میشود.
همچنین تشخیص جنبههای مختلف اشاره شده در متن و تحلیل دقیق رضایتمندی افراد از هر سرویسی (کیفیت محصول، زمان ارسال، رفتار پرسنل یا پشتیبانی و…) مواردی است که برای پشتیبانی، رفع اشکال و بهبود بهینه آن در یک سازمان بسیار کلیدی است.
در همین راستا یکی از تحلیلهایی که میتوان روی نظرات و متون منتشر شده در شبکههای اجتماعی مانند اینستاگرام (در کامنتها) و توییتر اعمال کرد، «تحلیل جنبههای متفاوت یک نظر» است. ما برای رسیدن به این مهم و افزودن ویژگیهای بیشتر به ابزار تحلیل زلکا، روشی را توسعه دادیم که در ادامه با در نظر گرفتن یک مثال به توضیح جزییات آن میپردازیم.
تحلیل موضوعی متون به کمک تشخیص رویکرد (Aspect Detection)
شبکههای اجتماعی اپلیکیشنهای سفارش غذا و وبسایت رستورانها مملو از نظرات مختلف کاربران و بستری پر از دادههای ارزشمندست که نیاز به تحلیل عمیق و شناسایی دقیق رویکرد دارند. به کامنت زیر توجه کنید:
«غذای رستوران خوشمزه بود اما با تأخیر زیادی سرو شد و قیمت ها هم بالا بود»
در اینجا به سه ویژگی رستوران شامل «کیفیت غذا، زمان آماده شدن و قیمت آن» اشاره شده است. برای انسان درک این سه ویژگی ذکر شده، آسان است امّا درک آن برای کامپیوتر و الگوریتمهای محاسباتی فرآیندی چالشبرانگیز است. هدف توسعهٔ روشهای تحلیل موضوعی متون این است که وقتی یک «نظر» به این شکل منتشر میشود، بهطور خودکار رویکردهای موجود در آن استخراج شده و سپس «احساسات» به تفکیک در ارتباط با «رویکردها» بهدست بیاید.
در روش توسعه داده شده، ابتدا زیرشاخههای مرتبط با هر موضوع را استخراج کردیم. برای مثال در ارتباط با رستوران، کلمات و عبارات کلیدی مانند کیفیت غذا، طعم غذا، رفتار کارکنان، دسترسی رستوران، زمان ارسال، بستهبندی و غیره از موضوعاتی هستند که مشتریان یک رستوران در ارتباط با آنها صحبت میکنند. بنابراین در گام اول باید «رویکردهای گوناگون نظرات کاربران» در ارتباط با موضوع مورد بررسی که در اینجا «رستوران» است را پیدا کنیم. سپس باید بهنوعی هر کدام از این «رویکردها» را در نظرات منتشر شده پیدا کنیم. برای این منظور از ابزارهای «Word embedding» و «POS tagging» استفاده میکنیم. بعد از آنکه رویکردهای مختلف موضوع مورد نظر آماده شد، به تحلیل احساسات این جنبهها در نظرات و متون منتشر شده در رسانهها میپردازیم.
فرآیند تحلیل احساسات - Sentiment Analysis
تحلیل احساسات یا همان Sentiment Analysis این نظرات، فرآیند پردازش دقیقتری دارند؛ در مثال گفته شده، خوشمزه بودن غذا رویکرد مثبت، سرو شدن غذا با تأخیر و بالا بودن قیمت، رویکرد منفی دارند که در روش توسعه داده شده در نهایت میزان رضایتمندی مخاطبان از هر جنبه سرویسدهی به دقت تفکیک میشود.
پیادهسازی Aspect detection در نمونهٔ واقعی
ما در زلکا روش گفته شده را روی دادههای واقعی که در ارتباط با کیفیت اینترنت در ایران بود، پیادهسازی کردیم. نتایج جالب توجهی از نظرات مردم در توییتر بدست آمد که میتواند راهگشای بسیاری از تصمیمگیریهای کلان کشور در این حوزه باشد. در ابتدا مجموعهای از دادههای عمومی توییتر فارسی در ارتباط با «اینترنت» در کشور جمعآوری شده و سپس به تحلیل رویکردهای گوناگون این نظرات پرداختیم. در نمودار زیر به تفکیک، رویکردهای مختلف نظرات کاربران در ارتباط با اینترنت در ایران را میبینید.
همانطور که میبینید تقریباً نیمی از نظرات، راجع به «سرعت پایین اینترنت» در کشور بوده است. سپس به ترتیب «فیلترینگ»، «قیمت بالا» و در نهایت هم «مسائل فنی - Technical Issues» بخشی دیگر از نظرات را بیان کردهاند. این موضوع با آنچه که از گفتگوهای روزانه جامعه میشنویم نیز مطابقت دارد.
همچنین در بخشی دیگر به تحلیل رویکردهای گوناگون «نظرات کاربران در صفحهٔ اینستاگرام وزیر ارتباطات» پرداختیم. همانطور که میبینید در بحث اینترنت ADSL، بیشتر نظرات (در حدود ٪۹۱) پیرامون «کیفیت اینترنت» بوده و در بحث اینترنت موبایل ٪۸۱ نظرات در ارتباط با «قیمت بالا» بوده است.
همچنین Sub-Aspects دیگر این موضوع را نیز در نمودارهای زیر میبینید:
شرح کامل گزارش «کیفیت اینترنت در ایران» را نیز میتوانید در وبلاگ زلکا بخوانید. در نهایت وجود این ویژگی در زلکا که تاکنون در زبانهای فارسی و عربی برای تعیین رویکرد کامنتها و نظرات، نظیر آن وجود نداشته، میتواند کمک بزرگی برای بیزینسهای مختلف برای شناخت بهتر نقاط ضعف و قوت خدمات و سرویسهای خود باشد و از آن مهمتر سلیقه و ذائقه مخاطبان و مشتریان خود را با جزئیات بیشتری درک کنند.