Proiect SCD - google

2x puncte

categorie: Informatica

nota: 9.04

nivel: Facultate

Câteva sfaturi pentru o căutare eficientă:

1. Fiți cât mai exact. Printr-o interogare precisă, se obțin mai puține rezultate și conținutul relevant este mai ușor de găsit. De exemplu, dacă am căutat cuvântul lege, am obținut aproximativ 3.580.000 de rezultate. Pentru căutarea lege drept autor am obținut 12.000 de rezultate, în timp ce pentru fraza exactă "lege privind dreptul de aut[...]
DOWNLOAD REFERAT

Preview referat: Proiect SCD - google

Câteva sfaturi pentru o căutare eficientă:

1. Fiți cât mai exact. Printr-o interogare precisă, se obțin mai puține rezultate și conținutul relevant este mai ușor de găsit. De exemplu, dacă am căutat cuvântul lege, am obținut aproximativ 3.580.000 de rezultate. Pentru căutarea lege drept autor am obținut 12.000 de rezultate, în timp ce pentru fraza exactă "lege privind dreptul de autor" am obținut 30 de rezultate.

2. Nu folosiți cuvinte uzuale. Utilizați cuvinte cât mai adecvate subiectului căutat, altfel utilitarul de căutare va returna zeci de pagini web cu informații irelevante pentru dumneavoastră. Vezi diferența între 5.570.000 rezultate pentru masă și 4.960 pentru mijloace comunicare masă.

3. Învățați să adaptați interogarea. Dacă interogarea dumneavoastră returnează prea multe rezultate, restrângeți aria de căutare. Dacă rezultatele returnate nu sunt suficiente, reformulați-o într-un mod mai general. Nu întotdeauna primele cuvinte -cheie sunt și cele mai bune.

4. Folosiți diferite forme ale cuvintelor. Puteți utiliza diferite cuvinte care se referă la subiectul căutat pentru a obține cât mai multe informații relevante pentru dumneavoastră.

5. Folosiți sinonimele. De exemplu, scrieți și ,,alergare" și "jogging". Dacă folosiți un utilitar de căutare care acceptă combinații de cuvinte - cheie, separați sinonimele prin cuvântul cheie OR

6. Folosiți citate între ghilimele. În cazul când căutați o anumită frază sau un titlu, plasațile între ghilimele (de ex. ,,Internet pentru începători") în formularul utilitarului de căutare.

7. Folosiți majuscule atunci când este necesar. Majoritatea directoarelor și indexurilor de căutare fac diferența între literele mici și literele mari din șirul de caractere căutat. Dacă textul introdus conține numai litere mici, utilitarul de căutare va identifica numai textul scris fie cu litere mari, fie cu litere mici. În cazul în care scrieți și o litera mare, utilitarul de căutare presupune ca aceasta are o semnificație specială și va afișa numai rezultatele care corespund exact șirului respectiv.

8. Aflați secretele utilitarului de căutare folosit. Unele utilitare de căutare oferă facilități speciale prin care conținutul relevant poate fi găsit mai ușor.

Google este cel mai mare motor de căutare și datorită parteneriatelor sale cu Yahoo!, Netscape și altele este capabil să răspundă la mult mai multe interogări decât orice alt serviciu online asemănător.

o Interogări soluționate în fiecare zi: peste 150 de milioane
o Pagini web parcurse: peste 2,4 miliarde.
o Tipuri de fișiere căutate
o HyperText Markup Language (html)
o Adobe Portable Document Format (pdf)
o Adobe PostScript (ps)
o Lotus 1-2-3 (wk1, wk2, wk3, wk4, wk5, wki, wks, wku)
o Lotus WordPro (lwp)
o MacWrite (mw)
o Microsoft Excel (xls)
o Microsoft PowerPoint (ppt)
o Microsoft Word (doc)
o Microsoft Works (wks, wps, wdb)
o Microsoft Write (wri)
o Rich Text Format (rtf)
o Text (ans, txt)
o Imagini: peste 330 milioane
o Mesaje Usenet: peste 700 de milioane

Utilizatori

Google.com este unul din primele zece dintre cele mai populare site-uri de pe Internet și este folosit de oameni din lumea întreagă

o Media lunară a numărului de utilizatori: 55.6 milioane (Nilesen/NetRatings 5/02)
o Gradul de utilizare atât acasă, cât și la birou: #4 (Nilesen/NetRatings 5/02)
o Limbile pentru care Google asigură o interfață: 81
o Limbile în care Google oferă rezultate: 35
o Utilizatori: mai mult de jumătate din traficul Google.com provine din afara USA.

Administrație

Personalul Google include profesioniști cu experiență în domeniul tehnologiei, iar compania este susținută de fonduri provenite de la două firme ce se ocupă cu investițiile de risc.
o Număr aproximativ de angajați: 400
o Deținători ai titlului de doctor: peste 50

Proiectarea unui motor de cătare este o provocare. Motoarele de căutare indexează zeci sau chiar sute de milioane de pagini web, implicând un număr echivalent de termeni distincți. Acestea raspund la zeci de milioane de întrebări în fiecare zi. Deși importanța acestor motoare de căutare pe web este mare, totuși ele nu au constituit subiectul unei cercetări academice amănunțite.

În plus, datorită gradului rapid de avansare a tehnologiei și dezvoltării continue a web-ului, metoda de creare a unui motor de căutare este foarte diferită de cea folosită acum trei ani. Această lucrare oferă o descriere amanunțită a motorului de cautare.

În afara problemelor de măsurare a capacității motoarelor tradiționale de căutare până la a putea suporta o cantitate importantă de date, există noi provocări tehnice corelate cu utilizarea informațiilor adiționale prezente în hipertext, cu scopul producerii de rezultate mai bune.

Lucrarea de fața pune aceasta întrebare, cum să construiești un sistem practic de măsurare care poate folosi informația adițională din hipertext. De asemenea, luăm în considerare modul de tratare efectiv al colecțiilor de hipertext, care nu pot fi în întregime controlate și unde fiecare este liber să publice ceea ce dorește.

Funcționarea Google - pe scurt

Hardware

Pentru a putea oferi capacitate suficientă de service, structura fizică a Google-lui este alcătuită din clustere și computere situate peste tot în lume, cunoscute sub numele de ferme de servere. Aceste ferme de servere sunt alcătuite dintr-un număr mare de computere de nivel jos pe care rulează sisteme bazate pe Linux care operează cu GFS (Sistemul de fișiere Google), iar cele mai mari dintre aceste ferme au peste 1000 de noduri de stocare și peste 300 de TB de spațiu de stocare pe disk.

S-a speculat că Google are cel mai mare computer din lume. S-a estimat că Google are în jur de:

o899 de rack-uri
o79, 112 mașini
o158,244 Unități centrale de prelucrare (UCP)
o316,448 GHz putere de procesare
o158,224 Gb de RAM
o6,180 Tb de spațiu pe Hard

Clustere-le sunt folosite pentru a face ca 2 sau mai multe calculatoare să apară ca unul singur pentru o comunitate de utilizatori. Custerele sunt folosite pentru a oferi fiabilitate crescută, și/sau pentru a crește performanța de pe un singur calculator.

Un cluster este un grup de calculatoare legate între ele care lucrează împreună ca un computer paralel. Una dintre cele mai populare implementări o reprezintă cluster-ul cu noduri pe care rulează Linux-ul ca și sistem de operare și software-ul Beowulf pentru a implementa paralelismul.

Microsistemele Sun și-au lansat de asemenea un produs gen cluster numit Grid engine.

De asemenea denumită și cluster de servere, fermă de computere sau ranch, o fermă de servere este un grup de servere legate prin rețea care sunt găzduite într-o singură locație. O fermă de servere modernizează procesele interne prin distribuirea lucrului între componentele individuale ale ,, fermei" și expediază procesele computaționale prin folosirea puterii mai multor servere.

,,Ferma" se bazează pe software-ul ,, load-balancing" care realizează sarcini cum ar fi urmărirea cererii pentru procesarea puterii de la diferite mașini, stabilind prioritatea temelor și programându-le și reprogramând-le în funcție de prioritatea și cererea pe care utilizatorii o pun pe rețea. Când un server din ,, fermă" eșuează, un altul poate interveni ca și back-up.

Un nod este un dispozitiv care este conectat ca și parte a unei rețele de calculatoare. Nodurile pot fi computere, personal digital assistants (PDAuri), telefoane mobile sau variate dispozitive ale rețelei. Pe o rețea IP, un nod este orice dispozitiv cu o adresă IP. Nodurile sunt deseori conectate prin centrale, routere sau printr-un switch de rețea.

Linux-ul este un sistem de operare gratuit de tip Unix, creat cu originalitate de către Linus Torvalds cu ajutorul unor programatori din jurul lumii. Creat sub licența GNU General Public, codul sursă pentru Linux este disponibil gratuit pentru toată lumea.
Un rack de 19 inch este un sistem standard pentru încărcarea unor module electronice variate într-o stivă sau un ,, grilaj" , cu o lărgime de 19 inch.
DOWNLOAD REFERAT
« mai multe referate din Informatica

CAUTA REFERAT


TRIMITE REFERAT CERE REFERAT
Referatele si lucrarile oferite de E-referate.ro au scop educativ si orientativ pentru cercetare academica.