Web adalah arsitektur berprinsip standar, bahasa dan
formalisms yang menyediakan platform untuk aplikasi heterogen banyak.
Hasilnya bisa mudah menjadi kusut, dan keputusan yang dibuat tentang
standar yang mengatur satu formalisme dapat memiliki konsekuensi di luar,
yang dapat timbal tentu saja untuk keputusan desain yang kompleks (cf. [146]). Memang,
beberapa tuntutan di Web membuat godaan untuk model yang
16.
3.1. Web Semantik 17
Trade-off antara expressivity
dan kegunaan adalah akibat dari penyalahgunaan umum dari formalisms tersebut. Untuk
contoh - kita akan membahas contoh ini secara lebih rinci di bawah ini - menggunakan
dari mesin, diimplementasikan dan diusulkan, dari Web Semantic
[35, 17] untuk memperpanjang Web merupakan tujuan umum. Tapi desain
SW dan terkait formalisms dan alat-alat dimaksudkan untuk memperpanjang
Web untuk menutupi data terkait, tidak, seperti yang sering diasumsikan, untuk meningkatkan pencarian
atau mendapatkan kekuatan yang lebih besar dari teks beranotasi (yang lain, terpisah,
jenis ekstensi dari Web).
Meninggalkan semantik underdetermined
berarti memaksa pengguna (manusia) untuk melakukan pembuatan rasa, seperti untuk
Misalnya dengan sistem P2P saat ini yang, jika mereka memaksakan semantik di
semua, cenderung hanya menggunakan sangat sederhana, tingkat rendah, struktur tugas-relatif. Dalam
3.1.1 Web Semantic
Tujuan Web adalah
untuk mengubah perilaku yang radikal dan menyediakan teknologi untuk melakukannya:
orang akan membuat dokumen mereka tersedia untuk orang lain dengan menambahkan link
18 Rekayasa Web
untuk membuat mereka dapat diakses dengan mengikuti lin Web Semantik (SW) merupakan upaya untuk memperluas potensi
Web dengan ekstensi analog perilaku orang. SW
mencoba untuk membuat orang untuk membuat data tersedia untuk orang lain, dan menambahkan
link untuk membuat mereka dapat diakses dengan mengikuti link.
Tujuan dari SW adalah untuk memfasilitasi menggunakan
data serta penemuan mereka, melampaui Google dalam hal ini.
Dalam konteks ini adalah layak disebut perbedaan antara
pengambilan informasi dan pengambilan data (alias questionanswering otomatis).
Tujuan yang pertama adalah untuk menghasilkan dokumen yang
relevan dengan query; dokumen ini tidak perlu menjadi unik, dan dua
episode berhasil pencarian informasi tetap dapat menghasilkan
hasil yang sama sekali berbeda. Tujuan yang terakhir adalah untuk menghasilkan
benar jawaban query.
3.1. Web semantik 19
SW adalah perpanjangan
dari WWW dalam hal yang menjadi tahap berikutnya menghubungkan - menghubungkan
data tidak dokumen.
Lapisan dari SW adalah Web Ontologi Bahasa OWL
[198], yang menyediakan sarana ekspresif dapat terhubung data ke dunia (seperti juga melakukan RDF RDF Schema atau-S - [44]). RDF dan OWL memungkinkan
pertukaran data dalam konteks dunia nyata, di atas inti ini akan
duduk bahasa query untuk RDF yang akan memungkinkan didistribusikan dataset untuk
di-query dengan cara yang standar dan dengan beberapa implementasi.
3.1.2 URI: Nama atau alamat? Atau keduanya?
URI digunakan sebagai predikat suatu mengidentifikasi hubungan antara hal-hal
diidentifikasi oleh node yang terhubung [172].
Secara umum, menggunakan URI untuk mengidentifikasi sumber daya merupakan faktor penting
dalam pengembangan Web [33].
Hubungan, diidentifikasi dengan URI, link sumber daya yang juga diidentifikasi
oleh URI.
Skema HTTP, untuk
misalnya, dilihat sebagai skema URL.
Oleh karena HTTP adalah skema URI, meskipun
sebuah URI HTTP mengidentifikasi objek dengan mewakili akses primer
mekanisme, dan sebagainya (informal) kita bisa bicara tentang URI HTTP yang
URL. Nama / alamat Perbedaan adalah sebuah metafora spasial yang bekerja
dengan baik dalam lingkungan komputasi standar, tapi dalam jaringan
sistem komputasi perbedaan rusak.
3.1.3 Ontologi
Sebuah ontologi dapat formal atau
informal. Keuntungan dari formalitas adalah bahwa hal itu membuat ontologi
mesin-dibaca, dan karena itu memungkinkan mesin untuk melakukan lebih dalam
penalaran atas sumber daya web. Kerugiannya adalah bahwa seperti formal
konstruksi yang dianggap sulit untuk membuat.
Sejauh itu, ontologi adalah mirip dengan skema database,
kecuali bahwa itu akan ditulis dengan relatif kaya dan ekspresif
bahasa, informasi akan kurang terstruktur, dan menentukan
teori domain, tidak hanya struktur sebuah wadah data [96].
Jadi ontologi dipandang sebagai tambahan berarti yang penting untuk berbagi data, dan
Tujuan utama memperlakukan Web sebagai satu-satunya sumber informasi, tetapi
mereka juga memiliki penentangnya.
Web adalah untuk membuat kesalahan klasifikasi atas-privileging ketika
datang untuk memahami bahasa manusia dan komunikasi [113]. Ini
tentu harus ditunjukkan bahwa banyak ontologi sebenarnya digunakan, untuk
Misalnya di industri, adalah taksonomi untuk klasifikasi tujuan khusus
dokumen atau halaman Web, cenderung tidak rumit, dan tidak bergantung
pada formalisms sangat ekspresif [88].
OWL cara adalah rekayasa khusus untuk Web dan Semantic Web,
dan simbol banyak bahasa berbagi ([cf 134.]).
logika Probabilistik adalah kalkuli yang memanipulasi konjungsi probabilitas
peristiwa individu atau negara, yang mungkin paling terkenal
adalah Bayesian, yang dapat digunakan untuk menurunkan probabilitas untuk acara-acara
didasarkan pada teori sebelumnya tentang bagaimana probabilitas didistribusikan (dan
sangat terbatas data real). penalaran Bayesian merupakan hal yang biasa dalam pencarian
mesin, dan bahkan mencari spam (cf. [117]).
3.1.4 Folksonomi Dan Struktur Sosial Muncul
Penggunaan ontologi menambah struktur data. Namun, struktur
dapat muncul secara organik dari manajemen individu mereka sendiri
persyaratan informasi, selama ada orang cukup.
Ada semakin banyak aplikasi didorong oleh desentralisasi
komunitas dari-bawah ke atas, yang pergi di bawah-sakit didefinisikan tetapi
3.1. Web Semantik 31
populer nama perangkat lunak sosial. Sebagai contoh, wiki adalah sebuah situs web
yang memungkinkan pengguna dan pembaca untuk menambah dan mengedit konten, yang memungkinkan
komunikasi, argumen dan komentar, Wikipedia (http://en.
wikipedia.org / wiki / Halaman Utama untuk versi bahasa Inggris), sebuah
ensiklopedi online yang ditulis oleh komunitas pengguna, telah menjadi sangat
handal meskipun kekhawatiran yang sedang berlangsung tentang kepercayaan entri yang
dan ketakutan dari vandalisme.
3.1.5 Ontologi Folksonomi v?
Dikatakan - meskipun saat ini argumen yang hanya penyaringan perlahan
ke dalam literatur akademik - yang folksonomi lebih disukai untuk
penggunaan dikendalikan, ontologi terpusat [mis 259]. Annotating Web
halaman menggunakan kosakata terkontrol akan meningkatkan kemungkinan seseorang
balik halaman di pencarian Web yang 'benar', namun di sisi lain
basis pengguna besar heterogen dari Web tidak mungkin mengandung
banyak orang (atau organisasi) bersedia untuk mengadopsi atau mempertahankan kompleks
ontologi.
3.1. Web Semantik 33
Folksonomi adalah varian pada keywordsearch yang
tema, dan merupakan upaya yang muncul di informasi menarik
pengambilan - bagaimana saya bisa mengambil dokumen (foto, katakanlah) yang relevan
dengan konsep di mana saya tertarik? Ontologi merupakan upaya untuk
mengatur bagian dari dunia data, dan untuk memungkinkan pemetaan dan interaksi
antara data dalam format yang berbeda atau lokasi, atau yang telah
telah dikumpulkan oleh organisasi yang berbeda dengan asumsi yang berbeda.
3.1. Web Semantik 35
Tujuan dari SW harus dilihat dalam konteks rutin
sifat jenis perjanjian. SW ini dimaksudkan untuk menciptakan dan
mengelola standar untuk membuka dan membuat perjanjian ini rutin parsial
dalam format data; standar tersebut harus memungkinkan untuk
eksploitasi data relasional pada skala global, dengan bersamaan
leverage bahwa skala yang membeli.
3.1.6 Metadata
Time-stamping adalah kepentingan karena unsur temporal konteks
adalah penting untuk memahami teks (untuk mengambil sebuah contoh nyata,
ketika membaca sebuah makalah tentang geopolitik global pada tahun 2006 adalah penting untuk mengetahui
apakah itu ditulis sebelum atau setelah peristiwa 11 September, 2001).
3.2 Referensi Dan Identitas
Semantic Web mengandalkan konvensi penamaan dengan URI, dan
Tentu saja setiap bagian dari sistem pelabelan Web yang bergantung pada beberapa konvensi
atau lainnya. Masalah dengan label di Web adalah bahwa setiap
tempat, dan di bawah naungan yang, dan catatan dari rantai
[57].
Web yang mengatur prinsip-prinsip, tetapi ini tidak sentralisasi memungkinkan
skema yang berbeda dan konvensi, dan memang kecerobohan, untuk berkembang,
yang pada gilirannya membuka kemungkinan kegagalan referensi unik.
3.2.1 Referensi: Kapan Dua Benda Yang Sama?
Desentralisasi adalah masalah dari sudut pandang logis, meskipun besar
keuntungan dari yang pencipta konten. Obyek yang sama mungkin
disebut online, sempurna benar, sebagai 'Jane Doe', 'Janey Doe', 'Jane
A. Doe ',' Doe, J.A. 'dan sebagainya. Selanjutnya, setiap atau semua istilah ini
dapat digunakan untuk merujuk ke objek yang berbeda. Dan, tentu saja, asli
Jane Doe mungkin misnamed atau salah eja: 'Jnae Doe', dll
Di sisi lain, URI menyediakan Web dengan sumber daya
untuk menghindari setidaknya beberapa masalah grounding tradisional, ketika
dapat diatasi bahwa dua istilah ini menunjuk ke URI yang sama.
Jadi jika "bintang pagi" dan "bintang malam" menunjuk langsung kepada
http://ex.org/planets.owl # venus maka setiap landasan lebih lanjut berlebihan.
Di sisi lain, dua URI yang berbeda mungkin mengacu sama
objek non-jelas, dan mungkin melakukannya hanya dengan melalui beberapa operasi
di mana ia digunakan.
Web 3.3 Rekayasa: Arah Baru
pembangunan Web adalah campuran dari standar-setting, tidak terstruktur,
desentralisasi kegiatan dan inovasi, dan rekayasa yang disengaja.
Pada bagian ini kita akan fokus pada yang terakhir, dan review menonjol
teknik isu dan keharusan terbuka. Pertumbuhan Web
jelas merupakan sesuatu yg diinginkan kunci. Penyimpanan jumlah semakin besar informasi,
dalam konteks perhitungan pernah-cepat, akan sangat vital untuk
masa mendatang.
3.3.1 Web Layanan
Layanan area utama di mana kami rekayasa model kebutuhan Web
untuk terlibat dan jasa extended.Web didistribusikan potongan kode
ditulis untuk memecahkan tugas-tugas tertentu, yang dapat berkomunikasi dengan layanan lain
melalui pesan. tugas yang berskala lebih luas dapat dianalisis dan secara rekursif
dipecah menjadi sub-tugas yang dengan peta keberuntungan akan ke spesifik
tugas-tugas yang dapat diatasi oleh layanan .
Sejumlah metode proses menentukan telah berkembang selama
beberapa tahun terakhir dan diterapkan pada domain layanan Web. Misalnya,
WS-Net adalah bahasa deskripsi arsitektural berdasarkan teori
Petri jaring berwarna (yaitu perluasan dari teori Petri sederhana bersih dengan
terhormat, token diidentifikasi - lihat Bagian 4.2.5 untuk diskusi singkat
Petri jaring), yang menggambarkan komponen layanan Web dalam hal
jasa yang memberikan untuk komponen lain, layanan yang diperlukan untuk
fungsi, dan operasi internal. Hasil akhirnya adalah model yang
mencakup baik global dan aspek-aspek lokal dari sistem pelayanan, memfasilitasi integrasi layanan Web untuk mencapai tujuan-tujuan baru, sementara juga menyediakan
sebuah formalisme untuk evaluasi integrasi [296].
3.3.2 Distributed Pendekatan: Komputasi Pervasif,
P2P Dan Grid
Sebagai contoh, penemuan layanan dalam paradigma meresap harus mengambil
tempat tanpa manusia dalam loop. Layanan harus mampu mengiklankan
diri untuk memfasilitasi penemuan. Standar layanan penerbitan
akan diperlukan untuk menjamin keamanan dan privasi, kepercayaan dari layanan
keandalan, kompensasi untuk penyedia layanan, dan tepat bagaimana
layanan akan terdiri dengan layanan dipanggil lain untuk mencapai
beberapa tujuan atau memecahkan masalah yang dihadapi [179].
Ini hanyalah salah satu contoh saat ini berkembang lingkungan komputasi
yang kemungkinan akan semakin penting.
Pertanyaan bagi para ilmuwan Web adalah apa yang
fungsi penting bagi pengalaman Web dapat disimpan dalam longgar
ditambah sistem otonomi. Mengingat karakteristik yang tidak biasa P2P,
termasuk nomor yang berpotensi besar dan heterogenitas dari node P2P,
tradisional rekayasa metode seperti eksperimentasi online (yang
akan membutuhkan sejumlah besar unfeasibly pengguna untuk mendaftar ke arsitektur
dan memungkinkan transaksi mereka yang akan dimonitor) atau simulasi besar-besaran
(Skala hanya terlalu besar) akan tidak pantas. Skala
izin dari Web, yang kami akan terus melihat dalam jaringan P2P,
membuat jaringan teori model penting (lih. misalnya [249, 189]), tapi kami
harus mengharapkan eksperimentasi inovasi, radikal dan semangat wirausaha
untuk memimpin upaya dalam bidang ini.
3.3.3 Personalisasi
Web tetap lebih dari commoditised satu ukuran cocok untuk semua daerah dan
malah menjadi sebuah ruang di mana orang dapat mengukir sendiri
niche. Selain itu, mereka juga harus dapat menerima layanan yang lebih baik,
disesuaikan dengan keadaan khusus mereka sendiri dan preferensi,
untuk sama atau hanya sedikit lebih biaya [90]. sistem industri tersebut adalah
jelas aplikasi teknologi [6].
Ada banyak program teknik berjalan menyelidiki
heuristik untuk personalisasi dari informasi yang tersedia, termasuk
menggunakan mesin belajar [120], ontologi [74, 165], jaringan P2P [126],
dan menghasilkan representasi untuk memfasilitasi pengumpulan informasi pengguna
[74, 157, 223], serta menyediakan lingkungan yang memfasilitasi
personalisasi [136, 53, 194] dan link asosiatif didasarkan pada user-bukan
dari penulis-preferensi [54]. Lain benang penting dari personalisasi
rekayasa adalah pengembangan alat untuk memungkinkan neophytes relatif
untuk menciptakan atau meningkatkan pengetahuan teknik artefak kompleks, seperti
ontologi [213, 211] atau pembungkus [250].
3.3.4 Multimedia
Web adalah lingkungan multimedia, yang membuat untuk kompleks
semantik - ini tentu saja tidak masalah yang unik ke Web. Metareasoning
dan epistemologi sering menganggap media tekstual, bahkan
meskipun sebenarnya banyak penalaran dalam bentuk analog. Misalnya
ahli sering menggunakan diagram untuk mengekspresikan pengetahuan mereka [174, 263].
Namun demikian, generasi Web berikutnya tidak harus didasarkan pada
palsu asumsi bahwa teks adalah pencarian dominan dan kata kunci berbasis
akan mencukupi untuk semua tujuan . Namun, pendekatan kata kunci mungkin goyah dalam multimedia
konteks karena kekayaan yang lebih besar dari banyak non-tekstual
Media [264]. Pendekatan gambar Google pencarian bergantung pada sekitarnya
teks untuk gambar, misalnya, yang memungkinkan pencarian yang relatif cepat,
dan sekali lagi pada umumnya pengguna seringkali mampu membuat pilihan final
memilah-milah rekomendasi yang disampaikan (gambar kata kunci berbasis
pencarian cenderung menghasilkan banyak hits lebih sedikit, yang mungkin berarti mereka
banyak kemungkinan hilang masuk akal)yang wajar [127].
3.3. Rekayasa Web: Arah Baru 49
Tentu saja, media di sini tergambar adalah foto dan video; terbuka
pertanyaan penelitian tetap tidak hanya tentang seberapa jauh orang bisa masuk
pencarian dengan pendekatan semacam, tetapi juga tentang berapa banyak media akan menyerah
sedemikian pendekatan dengan cara yang terintegrasikan.
3.3.5 Pemprosesan Bahasa Alam
NLP berhubungan dengan Web dalam beberapa cara. Di tempat pertama, alam
bahasa adalah domain yang sangat jarang, dalam kalimat yang paling diucapkan
atau tertulis hanya terjadi sekali atau sangat jarang, dan skala raksasa
Web menyediakan sebuah korpus menarik untuk penalaran NLP. Sebuah angka perkiraan baru-baru ini
untuk ukuran dari Web adalah dua ribu miliar kata, yang
71% adalah bahasa Inggris, Jepang 6,8% dan 5,1% Jerman.
Setara dalam SW kata-kata
bahasa alami adalah istilah-istilah logis, yang URI yang menonjol. Demikian
kita memiliki disanalogy langsung antara NLP dan SW, yang
yang URI, tidak seperti kata-kata, mempunyai pemilik, dan sehingga dapat diatur. Yang
bukan untuk mengatakan bahwa peraturan tersebut akan menjamin kekebalan dari makna
drift bahwa linguis mendeteksi, tetapi juga dapat memberikan stabilitas yang cukup selama
jangka pendek medium.