/tmp/coeum.jpg چگونه وب معنایی کار می کند - وبلاگ دیتا سنتر crmit

چگونه وب معنایی کار می کند


این احتمالا یک انتزاع کمی است، و آن است. در حالی که برخی از سایت ها از مفاهیم وب معنایی استفاده می کنند، بسیاری از ابزارهای لازم هنوز در حال توسعه هستند. در این مقاله، ما مفاهیم و ابزارهای پشت وب معنایی را به زمین می کنیم و با استفاده از آنها به یک کهکشان دور، دور.

 

چرا وب معنایی؟

فرض کنید شما میخواهید یک مجموعه “سه گانه جنگ ستارگان” را به صورت آنلاین خریداری کنید و معیارهای اولیه برای خریدتان را داشته باشید. اول، شما می خواهید صفحه نمایش بزرگ، و نه تمام صفحه، دی وی دی، و شما می خواهید مجموعه ای است که دیسک اضافی از مواد پاداش. دوم، شما می خواهید پایین ترین قیمت در دسترس، اما شما ترجیح می دهید برای خرید یک مجموعه جدید، نه استفاده می شود. در نهایت شما نمی خواهید بیش از حد برای حمل و نقل و حمل و نقل پرداخت، اما شما همچنین نمی خواهید برای تحویل بیش از حد صبر کنید.

در این مرحله در تکامل وب، بهترین شرط بندی شما این است که صفحات وب مختلف خرده فروشان را مقایسه کنید، قیمت ها و زمان و نرخ های حمل و نقل را مقایسه کنید. شما همچنین می توانید یک سایت را جستجو کنید که قیمت ها و گزینه های حمل و نقل را از چند خرده فروش در یک زمان مقایسه کند. در هر صورت، شما باید بسیاری از قوانین مجازی مجازی را انجام دهید، سپس تصمیم گیری خرید خود را انجام دهید و خود را به منظور سفارش خود قرار دهید.

با استفاده از وب معنایی، گزینه دیگری دارید. شما می توانید ترجیحات خود را به یک عامل کامپیوتری وارد کنید که در وب جستجو می کند، بهترین گزینه را برای شما پیدا می کند و سفارش خود را قرار می دهد. سپس نماینده می تواند نرم افزار شخصی مالی خود را در رایانه خود باز کند و مقدار شما را خرج کند و می تواند تاریخ دی وی دی های شما را در تقویم شما نشان دهد. نماینده شما همچنین عادت ها و ترجیحات شما را یاد می گیرد، بنابراین اگر تجربه بدی از یک سایت خاص داشتید می دانستید که دیگر از این سایت استفاده نکنید.

نماینده این کار را با نگاه کردن به تصاویر و توصیف خواندن مانند یک شخص انجام نمی دهد، بلکه با جستجو از طریق متادیتا که به وضوح شناسایی و تعریف آنچه را که نماینده نیاز به دانستن دارد. متاداده ها به سادگی اطلاعات قابل خواندن در دستگاه است که اطلاعات دیگر را توصیف می کنند. در وب معنایی، ابرداده های نامرئی به عنوان افرادی که صفحه را خوانده اند، اما به وضوح قابل مشاهده برای کامپیوتر هستند. متادیتا همچنین می تواند جستجوهای پیچیده تر و متمرکز وب را با نتایج دقیق تر انجام دهد. برای تایپ کردن تیم برنرز لی، مخترع شبکه جهانی وب، این ابزار به وب اجازه می دهد که در حال حاضر به یک کتاب غول پیکر تبدیل شود – به یک پایگاه داده غول پیکر تبدیل شده است.

ما به ابزارهایی می پردازیم که می توانند اسناد ماشین را بعدا خواند.

 

نشانه گذاری: XML و RDF

بگذارید بگوییم شما می خواهید این جمله را به رایانه تبدیل کنید:
آناکین اسکایوکلر پدر لوقا اسکولاکر است.

این برای شما آسان است که این جمله را بدانید – Anakin و Luke Skywalker هر دو مردم هستند، و بین آنها رابطه وجود دارد. شما می دانید که پدر نوعی از والدین است و این جمله نیز به این معنی است که لوک پسر پسر Anakin است. اما یک کامپیوتر نمیتواند بدون کمک آن را بیابد. برای اجازه دادن به رایانه برای درک آنچه که این جمله به این معنی است، شما باید اطلاعاتی را که قابل خواندن با ماشین است که آناکین و لوقا را توضیح می دهند و ارتباط آنها چیست، اضافه کنید. این با دو ابزار آغاز می شود – زبان نشانه گذاری eXtensible (XML) و چارچوب توصیف منابع (RDF).

XML
یک زبان نشانه گذاری مانند زبان نشانه گذاری متن (HTML) است که شما احتمالا تا حدودی از مرور وب استفاده می کنید. HTML به ظاهر اطلاعاتی که در وب نگاه می کنید، کنترل می شود. XML تکمیل شده (اما جایگزین) HTML با اضافه کردن برچسب هایی که داده ها را توصیف می کنند. این برچسب ها برای افرادی که سند را می خوانند قابل مشاهده نیست اما برای کامپیوتر قابل مشاهده است. برچسب ها در حال حاضر در وب استفاده می شود، و ربات های موجود، مانند ربات هایی که داده ها را برای موتورهای جستجو جمع آوری می کنند، می توانند آنها را بخوانند.

RDF
دقیقا همان چیزی است که نام آن نشان می دهد – با استفاده از تگ های XML، چارچوبی برای توصیف منابع فراهم می کند. در شرایط RDF، تقریبا همه چیز در جهان یک منبع است. این چارچوب منابع (هر عنصر مانند آناکین اسکایولکر یا “سه گانه جنگ ستارگان”) را با یک آیتم یا مکان خاص در وب متصل می کند تا کامپیوتر دقیقا همان چیزی را که منابع است دانست. به طور واضح منابع شناسایی کامپیوتر را از انجام کارهایی مانند اشتباه کردن آناکین اسکای واکر با سباستین شاو یا هیدن کریستینسن یا سه گانه اصلی با سه گانه “جنگ ستارگان” یک مرد می کند.

برای انجام این کار، RDF از برچسبهای XML به صورت سه گانه برای بیان این اطلاعات به عنوان یک گراف استفاده می کند. این سه گانه شامل یک موضوع، اموال و شیء است که مانند موضوع، فعل و هدف مستقیم یک جمله هستند. (بعضی منابع این موضوع را موضوع، پیش فرض و شیء می نامند.) RDF در حال حاضر در وب وجود دارد – به عنوان مثال، آن بخشی از ایجاد RSS خوراک است.

تا کنون در این مثال، کامپیوتر می داند که دو جمله در این جمله وجود دارد و رابطه بین آنها وجود دارد. اما نمی داند که اشیا چیست یا چطور با یکدیگر ارتباط دارند. ما به ابزار برای اضافه کردن این لایه معنای بعدی نگاه میکنیم.

 

دانستن چه چیزهایی: URI ها
حتی با چارچوبی که
XML و RDF ارائه می دهند، یک کامپیوتر هنوز به یک روش بسیار مستقیم و مشخص برای فهمیدن اینکه چه کسانی و چه این منابع هستند، نیاز دارد. برای انجام این کار، RDF از شناسه های یکپارچه منابع (URI ها) استفاده می کند تا کامپیوتر را به یک سند یا شی که نماینده منبع است، هدایت کند. شما قبلا با رایج ترین نوع URI آشنا هستید – یک منبع یک منبع URL (URL) که با http: // آغاز می شود. یک URI می تواند به هر چیزی در وب اشاره کند و همچنین ممکن است اشاره به اشیایی که در وب نیستند، مثل لوازم خانگی در خانه های کامپیوتری باشد. آدرسهای Mailto، ftp و Telnet بعضی نمونه های دیگر از URI هستند.

برای مثال ما از صفحات شخصیت های سایت رسمی جنگ ستارگان به عنوان URI های خود استفاده می کنیم.

در حال حاضر کامپیوتر می داند که موضوع و جسم چیست – آناکین اسکاولکر نهاد نمایندگی توسط اولین URI است، و لوک اسکای واکر نهاد نمایندگی توسط دوم است. اما متوجه خواهید شد که URI متوسط ​​در سه گانه ما – یکی برای ملک – به سایت جنگ ستارگان اشاره نمی کند. در عوض، آن را به یک سند معتبر بر روی سرور HowStuffWorks اشاره می کند. اگر این صفحه واقعا وجود داشته باشد، این می تواند فضای نام XML ما باشد.

بر خلاف HTML که از تگ های استاندارد مانند <b> برای bold و <u> برای خط زیر استفاده می کند، XML برچسب های استاندارد ندارد. این مفید است – این اجازه می دهد تا توسعه دهندگان برچسب های منحصر به فرد برای اهداف خاص ایجاد کنند. اما به این معنی است که مرورگر به طور خودکار نمی داند چه معنی آن برچسب است. یک فضای نام XML اساسا یک سند است که به برنامه ها معنی تمام برچسب ها را در سند دیگری می گوید. خالق یک سند XML، فضای نامی را در ابتدای سند با یک خط کد اعلام می کند. در مثال ما، اعلامیه فضای نام ما به این شکل خواهد بود:

<rdf: RDF xmlns: hsw = https: //www.crmit.ir/example/RDF/relationship
؛

این خط از کد به کامپیوتر می گوید: “هر علامت که از hsw شروع می شود، از واژگان موجود در این سند استفاده می کند. شما می توانید هر تگ را با hsw در اینجا جستجو کنید.” به این ترتیب، مردم می توانند برچسب های XML که برای یک سند نیاز دارند بدون تضاد با سایر اسناد XML در وب ایجاد کنند.

XML
و RDF “زبان رسمی” وب معنایی هستند، اما خودشان به اندازه کافی برای ایجاد کل وب برای یک کامپیوتر قابل دسترسی نیستند. ما بعضی از لایه های بعدی را نگاه می کنیم.

 

زبان ها و واژگان: RDFS، OWL و SKOS

مانع دیگری برای وب معنایی اینست که کامپیوترها نوعی واژگانی را که مردم انجام می دهند ندارند. شما تمام زندگی خود را به زبان مورد استفاده قرار داده اید، بنابراین احتمالا آسان است که ارتباط بین کلمات و مفاهیم مختلف را ببینید و معانی را براساس محتوا بیفزایید. متأسفانه کسی نمیتواند فقط یک فرهنگ لغت، یک کتاب المعارف و یک مجموعه دایره المعارف را به کامپیوتر بدهد و اجازه دهید کامپیوتر تمام اینها را به خود اختصاص دهد. به منظور درک آنچه کلمات به معنی و چه روابط بین کلمات، کامپیوتر باید اسناد و مدارک که تمام کلمات و منطق را برای ایجاد اتصالات لازم را توصیف کند.

در وب معنایی، این از طرح ها و هستی شناسی ها می آید. این دو ابزار مربوط به کمک به یک کامپیوتر درک واژگان انسانی هستند. یک هستیشناسی به سادگی یک واژگانی است که اشیا و نحوه ارتباط آنها با یکدیگر را توصیف می کنند. یک طرح یک روش برای سازماندهی اطلاعات است. همانند تگ های RDF، دسترسی به اسکامات ها و هستی شناسی ها در اسناد به عنوان ابرداده گنجانده شده است، و خالق سند باید اعلام کند که کدام هسته شناسی در ابتدای سند ارجاع می شود.

طرحواره و ابزار آنتولوژی که در وب معنایی استفاده می شود عبارتند از:

    
واژگان RDF واژگان توصیف زبان (RDFS) – RDFS کلاس ها، زیر کلاس ها و خواص را به منابع اضافه می کند، یک چارچوب زبان پایه ای ایجاد می کند. به عنوان مثال، منبع داگابا یک زیر مجموعه از سیاره کلاس است. اموال داگابا می تواند باتلاقی باشد.
    
سیستم سازمان دانش ساده (SKOS) – SKOS طبقه بندی منابع را از نظر وسیع تر و یا باریک تر، اجازه می دهد تا برچسب های ترجیح داده شده و جایگزین را اجازه می دهد و به مردم اجازه می دهد به سرعت به اصطلاحنامه ها و واژه نامه ها را به وب وارد کند. به عنوان مثال، در لغت نامه جنگ ستارگان، اصطلاح باریکتر برای خداوند سیتی میتواند دارت سیدی باشد و اصطلاح وسیعتر میتواند بدبخت باشد. به همین ترتیب، برچسب های جایگزین برای هان انو ممکن است گله نرف و مغز لیزر باشد.
    
زبان هستی شناسی وب (OWL) – OWL، پیچیده ترین لایه، هستی شناسی را رسم می کند، روابط بین کلاس ها را توصیف می کند و از منطق برای انجام کسر استفاده می کند. همچنین می تواند کلاس های جدید بر اساس اطلاعات موجود ایجاد کند. OWL در سه سطح پیچیدگی – Lite، Language Description (DL) و Full قرار دارد.

مشکل با هستی شناسی این است که آنها برای ایجاد، پیاده سازی و حفظ بسیار دشوار است. بسته به گستره وسیعی از آنها، می تواند بسیار زیاد باشد، تعریف گستره وسیعی از مفاهیم و روابط. بعضی از توسعه دهندگان ترجیح می دهند بیشتر به منطق و قوانین توجه بیشتری نسبت به هستی شناسی ها به دلیل این مشکلات داشته باشند. اختلاف نظر در مورد نقش هایی که این قوانین باید انجام دهند ممکن است یکی از دلایل احتمالی برای وب معنایی باشد.

بعد، ما با نگاهی به مثال اصلی خود – این “دیالوگ های جنگ ستارگان جنگ” می توانیم همه را با هم هماهنگ کنیم.

 

همه چیز را باهم در هم می آمیزیم

در مثال اصلی ما، ما در مورد خرید DVD های جنگ ستارگان آنلاین صحبت کردیم. در اینجا این است که چگونه وب معنایی می تواند کل پروسه را ساده تر کند.

    
هر سایت دارای متن و تصاویر (برای افرادی که برای خواندن) و متادیتا (برای رایانه برای خواندن) توصیف دی وی دی های موجود برای خرید در سایت خود دارند.
    
متادیتا، با استفاده از RDF سه گانه و برچسب های XML، تمام ویژگی های DVD ها (مانند شرایط و قیمت) را قابل خواندن در ماشین می کند.
    
در صورت لزوم، کسب و کارها از هستی شناسی استفاده می کنند تا به واژگان کامپیوتری برای توصیف تمام این اشیاء و ویژگی های آنها نیاز باشد. سایت های خرید می توانند از همان هستی شناسی استفاده کنند، بنابراین تمام متادیتا در یک زبان مشترک قرار خواهند گرفت.
    
هر سایت فروش دی وی دی ها همچنین از اقدامات امنیتی و رمزنگاری مناسب جهت محافظت از اطلاعات مشتریان استفاده می کند.
    
برنامه های کاربردی کامپیوتری یا عامل ها تمام متادیتای موجود در سایت های مختلف را خوانده اند. این برنامه ها همچنین می توانند اطلاعات را مقایسه کنند، تأیید کنند که منابع دقیق و قابل اعتماد هستند.

البته، وب بسیار زیاد است و اضافه کردن تمام این ابرداده به صفحات موجود، یک وظیفه بزرگ است. ما در این و برخی از موانع بالقوه دیگری برای وب معنایی بعدی به دنبال آن خواهیم بود.

 

W3C و آینده وب معنایی

مانند وب جهان گستر، وب معنایی غیر متمرکز است – هیچ یک از سازمانها یا آژانس بر تمام قوانین و محتوای آن نظارت ندارد. با این حال، بعضی از افراد و سازمان ها نقش رهبری در توسعه دستورالعمل ها و پروتکل های وب معنایی دارند. این شامل کنسرسیوم جهانی وب (W3C)، مدیر تیم برنرز لی و سازمان های عضو آن است. W3C یک سازمان پژوهشی نیست، بنابراین دانشگاه ها، سازمان های دیگر و مردم نیز نقش فعال در توسعه وب معنایی دارند.

برخی از مناطق جهان وب در حال حاضر شامل عناصر وب معنایی است. این شامل RSS های خوراکی است که از RDF و Friend-of-Friend (FOAF) استفاده می کنند که پیشنهاد می کند صفحات وب شخصی شخصی قابل خواندن را ایجاد کنند.

اما بسیاری از عملکردهای و عملیات وب معنایی هنوز در حال توسعه هستند و برخی از موانع بسیار بزرگ برای غلبه بر آن وجود دارد. Decentralization به توسعه دهندگان اجازه می دهد تا دقیقا برچسب ها و هستی شناسایی هایی را که نیاز دارند ایجاد کنند. اما، همچنین این بدان معنی است که توسعه دهندگان مختلف ممکن است برای توصیف همان چیزها از برچسب های مختلف استفاده کنند، که می تواند مقایسه های ماشین را دشوار کند. منتقدان همچنین “مشکل هویت” را مورد سوال قرار می دهند – آیا URI یک صفحه وب را نشان می دهد یا نشان دهنده مفهوم یا شیء است که صفحه توصیف می کند. به عنوان مثال، “http://www.starwars.com” به معنای نمایش فیلمهای “جنگ ستارگان” یا فقط صفحه وب است؟

برخی از توسعه دهندگان در مورد این که آیا وب معنایی باید به شدت به قوانین و یا هستی شناسی متکی باشد، مخالف است. منتقدان همچنین می گویند که این پروژه بسیار غیر عملی است. اول، مردم در واقع از نظر گراف هایی که از RDF استفاده می کنند فکر نمی کنند. دوم، بعید به نظر می رسد که کسب و کارها و سایت های موجود، زمان و منابع مورد نیاز برای افزودن تمام متادیت های لازم را اختصاص دهند. در آینده، نرمافزار خاموش میتواند گزینههایی برای افزودن متادیتا در هنگام ایجاد اسناد جدید شامل شود، اما این ابزار همچنان ممکن است پروژه را در مقیاس وسیعتر اجرا نکند.

 

دیدگاه‌تان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *