wikipedia.infostar.cz

Sémantický web

Sémantický web je vyvíjející se rozšíření World široký web ve kterém sémantika informací a služby na webu je definován, umožňovat to pro web porozumět a uspokojit žádosti osob a strojů používat obsah webu. To pochází z World široký web ředitel konsorcia sir Tim Berners-Leeova představa sítě jako univerzální médium pro data, informace a výměnu znalostí.

U jeho jádra, sémantický web zahrnuje soubor principů designu, spolupracovních pracovních skupin a palety umožňujících technologií. Některé prvky sémantického webu jsou vyjádřeny jako potenciální budoucnost možnosti, které jsou zatím být splnil nebo si uvědomil. Jiné prvky sémantického webu jsou vyjádřeny ve formálních specifikacích. Někteří tito zahrnují Resource popisovou kostru (RDF), paleta formátů výměny dat (např. RDF/XML, N3, želva, N-se trojnásobí), a notace takový jako RDF schéma (RDFS) a webový ontologický jazyk (sova), všichni který být zamýšlel poskytovat formální popis pojetí, termíny a vztahy uvnitř daných znalostí doména.

Nepřehlédněte: Tato stránka obsahuje strojový překlad textu z anglické encyklopedie Wikipedia. Pokud budou některé pasáže špatně srozumitelné, zkuste se podívat i na text v originále, který najdete pod odkazem Semantic Web. Překlad byl vytvořen pomocí překladače Eurotran.

Účel

Lidé jsou schopní používání síť uskutečnit úlohy takový jako najití finského slova pro “opici”, rezervovat knihovní knihu a hledání pro nízkou cenu DVD. Nicméně, počítač nemůže vykonat stejné úkoly bez lidského směru, protože internetové stránky jsou navrhnuty být přečten lidmi, ne stroje. Sémantický web je představa informací, které jsou pochopitelné počítači, tak že oni mohou hrát více nudné knihy zapojené do nálezu, sdílení a spojujících se informací na webu.

Tim Berners-Lee původně vyjadřoval představu sémantického webu takto:

Já mám sen pro web [ve kterých počítačích] stát se schopný analyzovat celého data na webu – obsah, odkazy a transakce mezitím osídlí a počítače. “sémantický web”, který by měl dělat toto možný, má přesto se objevit, ale když to dělá, každodenní mechanismy obchodu, byrokracie a naše běžné životy budou se ovládal stroji mluvit se stroji. “inteligentní agenti” lidi nabízeli letu nakonec se zhmotní.

Tim Berners-Lee, 1999

Sémantické vydávání bude prospívat velmi od sémantického webu. Zvláště, sémantický web je čekal, že revolucionizuje vědecké vydávání, takový jak real-time publikovat a sdílet to experimentálních dat na internetu. Tento jednoduchý ale radikální nápad je nyní bytí prozkoumané W3C HCLS skupinou je vědecké vydávání bojová jednotka.

Tim Berners-Lee popisoval sémantický web jako součást webu 3.0.

Vztah k webu hypertextu

Limitace HTML

Mnoho informací o typickém počítači může být volně rozděleno do dokumentů a dat. Dokumenty jako poštovní zprávy, zprávy a brožury jsou přečteny lidmi. Data, jako kalendáře, addressbooks, playlists a spreadsheety být představován používat aplikační program, který nechá je být viděn, hledal a se spojoval mnoha způsoby.

Nyní, internetová síť je umístěná hlavně na dokumentech psaných v Hypertext značkovacím jazyce (HTML), konvence značení, která je užitá na kódování skupina textu rozptýleného s multimédii namítá takový jako obrazy a interaktivní formy. Metadata přívěsky, například

< jméno meta = “klíčová slova” obsah = “práce na počítači, počítač studuje, počítač “> < jméno meta = “popisový” obsah = “levné věcičky na prodej “> < jméno meta = “autorský” obsah = “Lucy Changová “>



poskytovat metodu kterými počítači moci roztřídit obsah internetových stránek.

S HTML a nástroj vyjádřit to (možná software internetového prohlížeče, snad další agent uživatele), jeden může vytvářet a představovat stranu, která vypíše položky na prodej. HTML tohoto katalogu strana může dělat jednoduchý, dokument-tvrzení úrovně takový jak “titul tohoto dokumentu je ' věcička Superstore '”. Ale není tam žádná schopnost uvnitř HTML sám tvrdit jednoznačně to, například, číslo položky X586172 je Acme věcička se maloobchodní cenou €199, nebo že to je spotřební výrobek. Poněkud, HTML moci jen říkat, že rozpětí textu “X586172” je něco to by mělo být umístěno blízko “Acme věcička” a “€ 199”, etc. Není tam žádný způsob, jak říkat “toto je katalog” nebo dokonce prokázat, že “Acme věcička” je druh titulu nebo to “€ 199” je cena. Tam je také žádná cesta ke expresu že tyto kusy informací jsou svázány spolu v popisovat jednotlivou položku, odlišný od jiných položek možná zaznamenaný na straně.

Sémantický HTML se odkazuje na tradiční HTML praxi značení sledovat úmysl, spíše než specifikovat detaily nákresu přímo. Například, použití < em > naznačovat “důraz” spíše než < i >, který specifikuje kurzívy. Uspořádávací detaily jsou nechány k prohlížeči, v kombinaci s Cascading stylovými předlohami. Ale tato praxe postrádá specifikování sémantika objektů takový jako položky na prodej nebo ceny.

Microformats reprezentuje neoficiální pokusy rozšířit HTML syntax vytvořit stroj-čitelné sémantické značení o objektech takový jako maloobchodní prodejny a položky na prodej.

Sémantická webová řešení

Sémantický web vezme řešení dále. To zapojí vydávání do jazyků specificky určených pro data: Zdrojová popisová kostra (RDF), webový ontologický jazyk (sova), a rozšiřitelný značkovací jazyk (XML). HTML popisuje dokumenty a spojení mezi nimi. RDF, sova, a XML, kontrastem, moci popisovat libovolné věci takový jako lidé, setkání nebo části letadla. Tim Berners-Lee volá výslednou síť Linked dat obr globální graf, v kontrastu k HTML-založil internetovou síť.

Tyto technologie jsou spojeny v rozkazu poskytovat popisy, které doplní nebo nahradí obsah dokumentů webu. Tak, obsah může projevit, zatímco popisná data skladovala ve webu-dostupné databáze, nebo jak značení uvnitř dokumentů (zvláště, v rozšiřitelný HTML (XHTML) roztrousil s XML, nebo, více často, čistě v XML, s nákresem nebo vizualizací narážky skladovaly odděleně). Stroj-čitelné popisy umožní manažery obsahu přidat význam k obsahu, tj. popisovat strukturu znalostí, které my máme o tom obsahu. Tímto způsobem, stroj může zpracovávat poznatek sám, místo textu, použití postupů podobného lidskému deduktivnímu uvažování a závěru, proto získat významnější výsledky a pomoci počítačům vykonávat automatizované shromažďování informací a výzkum.

Příklad značky, která by byla použita v non-sémantická internetová stránka:

Kódovat podobné informace v sémantické internetové stránce by mohly vypadat jako toto:

Vztah k objektu určoval programování

Množství autorů upozornit na podoby který Semantic web sdílí to s objektově orientovaný programovat (OOP). Jak sémantický web tak objektově orientované programování mají úrovně s atributy a představou o příkladech nebo objektech. Spojená data používají Dereferenceable uniformu identifikátory zdroje ve způsobu podobném obyčejné programovací představě o ukazatelích nebo “identifikátorech objektu” v OOP. Dereferenceable URIs může tak být zvyklý na přístup “data odkazem”. Sjednocené modelování jazyk je navrhnut komunikovat o objektově orientovaných systémech, a moci tak být užitý na jak objektově orientované programování tak sémantický webový vývoj.

Když web nejprve byl vytvořen v pozdních osmdesátých létech a časných devadesátých létech, to bylo hotové používání objektově orientované programování jazyky[pochvalná zmínka potřebovala] takový jak Cíl-C, Smalltalk a CORBA. V střední-devadesátá léta tato praxe vývoje byla podporována s oznámením Podnik namítá kostra, Přenosné distribuované objekty a WebObjects všichni Příště, navíc k Komponentový objektový model povolený Microsoft. XML byl pak vydán v roce 1998, a RDF rok po v roce 1999.

Podobnost s objektem orientované programování také přišlo ze dvou jiných cest: první byl vývoj samých znalostí-centric “Hyperdocument” systémy Douglas Engelbart , a sekunda přijde z použití a vývoje Hypertextový převodový protokol.[objasnění potřebovalo]

Skeptické reakce

Praktická proveditelnost

Kritici ptají se základní proveditelnosti dokončit nebo vyrovnat částečné naplnění sémantického webu. Někteří vyvinou jejich kritiku od pohledu lidského chování a osobní preference, který zdánlivě zmenšit pravděpodobnost jeho naplnění (vidět např., metacrap). Jiní komentátoři namítají, že tam jsou limitace, které pocházejí ze současného stavu softwarového inženýrství sám (vidět např., děravá abstrakce).

Kde sémantické webové technologie našly větší míru praktického přijetí, to inklinovalo být mezi jádrovat specializovaná společenství a organizace pro intra-projekty společnosti. Omezení praktické zkoušky k přijetí vypadala méně náročná kde doména a rozsah je omezenější než to široké veřejnosti a celosvětová pavučina.

An unrealized nápad

Originál 2001 vědeckého amerického článku Berners-Lee popisoval očekávanou evoluci existujícího webu ke sémantickému webu. Takový evoluce má zatím nastat. Opravdu, více nedávný článek od Berners-Lee a kolegové říkali, že: “tento snadný nápad, nicméně, zůstane velmi unrealized.”

Cenzura a soukromí

Nadšení pro sémantický web mohlo být zmírněno znepokojeními pozorovat cenzuru a soukromí. Například, text-analyzovat techniky mohou nyní být snadno obejity tím, že používá jiná slova, metafory pro příklad, nebo tím, že používá obrazy v místě slov. Pokročilá realizace sémantického webu by dělala to hodně snadnější pro vlády ke kontrole hledění a vytvoření online informací jak těchto informací by byli hodně snadnější pro automatizovaný obsah-blokovat stroj rozumět. Navíc, záležitost také byla zvýšil to, s použitím FOAF soubory a umístění geo meta-data, tam by byla velmi malá anonymita spojená s autorstvím článků o věcech takový jako osobní blog.

Zdvojnásobující se výstupní formáty

Další kritika sémantického webu je že to by bylo hodně více časově náročné vytvářet a vydávat obsah protože tam by potřeboval být dva formáty pro jeden kus dat: jeden pro člověka sledovací a jeden pro stroje. Nicméně, mnoho aplikací webu ve vývoji vyjádří se k této otázce tím, že vytvoří stroj-čitelný formát na vydávání dat nebo žádosti stroje pro taková data. Vývoj microformats byl jedna reakce na tento druh kritiky.

Specifikace takový jak eRDF a RDFa dovolí libovolná RDF data být zasazený v HTML stranách. GRDDL (sbírat popisy zdroje od dialektů jazyka) mechanismus dovolí existovat materiál (včetně microformats) být automaticky interpretovaný jako RDF, tak vydavatelé jen potřebují použít jediného formátu, takový jak HTML.

Potřeba

Nápad ' sémantický web ' nutně pocházet z nějakého kódu známkování jiný než jednoduchý HTML je postaven na předpokladu, že to není možné pro stroj přiměřeně interpretovat kód založený na ničem ale objednávku vztahy dopisů a slov. Jestliže toto není pravdivé, pak to může být možné se budovat ' sémantický web ' na HTML osamocený, výroba specificky postavený ' sémantický web ' kódovací systém zbytečný.

Tam jsou latentní dynamické síťové modely, které mohou, pod určitými podmínkami, být ' cvičil ' k přiměřeně ' se učit ' význam založený na datech objednávky, v procesu ' učení ' vztahy s objednávkou (druh základní pracovní gramatiky). Vidět například latentní sémantická analýza.

Komponenty

Sémantický web zahrnuje standardy a nástroje XML, XML schéma, RDF, RDF schéma a sova to být organizován v sémantické webové hromadě. Web sovy ontologický jazykový přehled popisuje funkci a vztah každého těchto součástí sémantického webu:

  • XML poskytuje základní syntax pro strukturu obsahu uvnitř dokumentů přesto kolegy žádná sémantika s významem obsahu obsahovala uvnitř.
  • XML schéma je jazyk pro poskytovat a omezovat strukturu a obsah elementů obsahovaných uvnitř XML dokumentů.
  • RDF je jednoduchá řeč pro vyjadřovat datové modely, který odkazovat se na objekty (“prostředky”) a jejich vztahy. RDF-založený model může být reprezentován v XML syntaxi.
  • RDF schéma je slovník pro popsaní vlastností a třídy RDF-založené prostředky, s sémantikou pro celkový-hierarchie takových vlastností a tříd.
  • Sova přidá více slovníku pro popsaní vlastností a tříd: mezi ostatními, vztahy mezi třídami (např. disjointness), mohutnost (např. “přesně jeden”), rovnost, bohatější psaní vlastností, charakteristiky vlastností (např. symetrie), a vyjmenoval třídy.
  • SPARQL je protokol a dotazovací jazyk pro sémantické webové zdroje dat.

Aktuální pokračující standardizations obsahují:

  • Ovládat výměnu formátovat (RIF) jako pravidlová vrstva sémantické webové hromady

Záměr má zlepšit použitelnost a užitečnost sítě a jeho propojené prostředky přes:

  • Servery, které vystaví existující datové systémy používat RDF a SPARQL standardy. Mnoho konvertorů k RDF existuje od různých aplikací. Relační databáze jsou důležitý zdroj. Sémantický webový server se váže k existujícímu systému bez ovlivňovat jeho operaci.
  • Dokumenty “zdražily” s sémantickými informacemi (rozšíření HTML < meta > značky používané v dnešních internetových stránkách dodat informaci pro motory hledání na internetu používat crawlers webu). Toto mohlo být stroj-pochopitelná informace o člověku-pochopitelný obsah dokumentu (takový jako tvůrce, titul, popis, etc., dokumentu) nebo to mohlo být čistě metadata reprezentovat soubor faktů (takový jako zdroje a služby jinde na místě). (si všimnout toho něco to může být poznáno s Uniform zdrojovým identifikátorem (Uri) může být popisován, tak sémantický web může uvažovat o zvířatech, lidi, místa, nápady, etc.) sémantické značení je často tvořeno automaticky, spíše než ručně.
  • Obyčejné metadata slovníky (ontologies) a mapy mezi slovníky, které dovolí dokumentují tvůrce vědět to jak zdražit jejich dokumenty tak že agenti mohou používat informace v dodávaném metadata (tak to Author ve smyslu ' Author strany ' nebude být zmatený s Author ve smyslu pro knihu, která je předmět knižní recenze).
  • Automatizovaní agenti provádět úkoly pro uživatele sémantického webu používat tohoto data
  • Internetové služby (často s agenty jejich vlastní) dodat informaci specificky k agentům (například, služba důvěry že agent mohl se zeptat jestliže nějaký internetový obchod má minulost ubohých služeb nebo rozesílání nežádoucích e-mailů).

Projekty

Tato sekce poskytuje některé projekty příkladu a nástroje, ale je velmi neúplný. Volba projektů je poněkud libovolná ale smět mít ilustrativní účely. To je také pozoruhodné, že v tomto časném stádiu vývoje sémantické webové technologie, to je už možné sestavit seznam stovek komponent to v jedné cestě nebo jiný může být použit ve stavbě nebo prodlužujících se sémantických webech.

DBpedia

DBpedia je úsilí uveřejnit uspořádaného údaje extrahováno z Wikipedia: data jsou vydávána v RDF a vyrobený dostupný na webu k použití dolů GNU osvobodí dokumentační licenci, tak dovolovat Semantic webové agenty poskytovat inferencing a pokročilý se ptát přes Wikipedia-odvodil datovou sadu a usnadnění spojovat se, re-použití a rozšíření v ostatních datech-zdroje.

FOAF

Populární aplikace sémantického webu je přítel přítele (nebo FoaF), který popisuje vztahy mezi lidmi a ostatní agenty v podmínkách RDF.

SIOC

SIOC projekt - Semantically-spojil online společenství poskytuje slovník termínů a vztahy, které modelují webové datové prostory. Příklady prostorů takových dat obsahují, mezi ostatními: diskuzní fóra, weblogs, blogrolls / krmit předplatná, adresáře, sdílené záložky, galerie obrazu.

Otevřít GUID

Mířil na poskytovat kontext sémantickému webu, Open GUID udržuje globální Identifier úschovnu pro použití ve spojeném webu. Doména-přesný Ontologies a vydavatelé obsahu navážou identitní vztahy s Open GUIDs.

Podobenství

Sémantická součinnost Metadata a informace v na rozdíl od prostředí

Podobenství je společný projekt, dirigoval MIT knihovnami a MIT CSAIL, který snaží se zlepšit součinnost mezi digitální jmění, schémata/slovníky/ontologies, meta data a služby.

NextBio

Spojení databáze vysoce-průchodnostní vědy o životě experimentální data značila a připojila se přes biomedicínské ontologies. Nextbio je přístupný přes rozhraní vyhledávače. Výzkumníci mohou přispívat jejich nálezy pro incorporation k databázi. Databáze současně podporuje gen nebo bílkovinová výrazová data a je pevně rozšiřující se podporovat jiné biologické datové typy.

Spojovat otevřená data

[ve spojování otevřít projekt dat, jak Sept 2008]

Spojování otevřený datový projekt je společenství-vedl úsilí vytvořit otevřeně dostupný, a se spojil, RDF data na webu. Data v pochybnost vezmou formu RDF datových souborů kreslených od široké sbírky zdrojů dat. Tam je zájem o Linked datový styl vydávání RDF na webu. Vidět # Triplify pro malý plugin k datům výkladu od vaší aplikace webu jako Linked data.

Projekt je jeden několik podporovaný W3C sémantickým webem vzdělání a zájem dosahu seskupí (SWEO).

Služby

Služby zprávy

Sémantická webová Ping služba

Sémantická webová Ping služba je oznamovací servis pro sémantický web, který sleduje vytvoření a modifikace RDF založila zdroje dat na webu. To poskytuje webové služby pro volně spojené sledování RDF dat. Navíc, to poskytuje zhroucení RDF zdrojů dat sledovaných slovníkem, který obsahuje: SIOC, FOAF, DOAP, RDFS, a sova.

Piggy Bank

Další volně stahovatelný nástroj je zásuvný modul Piggyho Banka k Firefox. Piggy uhradí práce odebíráním nebo překládající webové zápisy do RDF informací a uchovávání této informace na uživatelském počítači. Tyto informace mohou pak být získány nezávisle na originálním kontextu a použitý v jiných kontextech, například tím, že používá Google mapy k informacím displeje. Piggy Bank pracuje s novou službou, sémantická banka, který kombinuje myšlenku na informace značení s novými webovými jazyky. Piggy Bank byl vyvinut projektem podobenství, který také poskytuje RDFizers, nástroje, které mohou být překládaly specifické druhy informací, například zprávy o počasí pro nás zapnou kódy, do RDF. Úsilí jako tito mohla uklidnit potenciálně znepokojující přechod mezi webem dnes a jeho sémantický nástupce.

Viz též

Další četba

Externí odkazy

Sémantický webový software a demonstrace