WEB ΚΑΙ ΜΗΧΑΝΕΣ ΑΝΑΖΗΤΗΣΗΣ

~ΠΡΟΛΟΓΟΣ

Στις σημειώσεις αυτές γίνεται αναφορά στις μηχανές αναζήτησης και στον Internet Explorer.

To www (ή W3 ή απλώς Web) είναι μια υπηρεσία δικτυωμένων πληροφοριών η οποία παρέχει ένα σύστημα προσπέλασης πληροφοριών πολυμέσων με υπερκείμενο.

Δημιουργήθηκε το 1992 στο CERN (Ευρωπαϊκό κέντρο για πυρηνική έρευνα) και ο αρχικός σκοπός του ήταν να βοηθήσει τους φυσικούς από τα διάφορα μέρη του κόσμου να ανταλλάσσουν αποτελέσματα.

Σήμερα εκατομμύρια χρήστες του Internet με τελείως διαφορετικά ενδιαφέροντα αναζητούν πληροφορίες μέσω του www ή δημοσιεύουν τις δικές τους πληροφορίες καθιστώντας τες προσπελάσιμες στον καθένα.

Για να ανακτήσει κανείς κάτι από το www αρκεί να ξέρει πως να φτάσει σ' αυτό και σε γενικές γραμμές για πιο θέμα ενδιαφέρεται. Αυτό είναι εφικτό χάρη  στις μηχανές αναζήτησης.

Στο πρώτο μέρος των σημειώσεων παραθέτουμε βασικές τεχνικές αναζήτησης , κατηγοροποιημένες λίστες μηχανών αναζήτησης και ανάπτυξη μερικών από αυτές.

Το λογισμικό με το οποίο ο χρήστης αναζητεί και εμφανίζει τις πληροφορίες ονομάζεται φυλλομετρητής (browser). Οι δημοφιλέστεροι browsers σήμερα είναι ο Netscape Navigator και ο Internet Explorer. Στο δεύτερο μέρος των σημειώσεων παρατίθενται τα κυριότερα γνωρίσματα του Internet Explorer 5 όπως μπάρες εργαλείων, favorites,e-mail.

 

ΠΡΩΤΟ ΜΕΡΟΣ

WWW-ΜΗΧΑΝΕΣ ΑΝΑΖΗΤΗΣΗΣ (SEARCH ENGINES)

 

1.     Εισαγωγή

Τι είναι;

Eίναι τοποθεσίες (sites) που παρέχουν πληροφορίες άλλων τοποθεσιών. Οι τοποθεσίες είναι κατηγοριοποιημένες ανά θεματική ενότητα.

Π.χ αν μία τράπεζα θέλει να καταχωρηθεί σε μία μηχανή αναζήτησης ώστε να μπορεί εύκολα να ανευρεθεί από το κοινό ,κάνει μία αίτηση προς τη μηχανή (συνήθως e-mail). H μηχανή με τη σειρά της αξιολογεί την τοποθεσία και την καταχωρεί στην κατηγορία ΤΡΑΠΕΖΕΣ.

Στην πραγματικότητα αυτό που καταχωρείται είναι ένας υπερσύνδεσμος (hyperlink ) προς την τοποθεσία.Αξίξει να σημειωθεί ότι η παραπάνω υπηρεσία παρέχεται εντελώς δωρεάν. Οι ίδιες οι μηχανές αναζήτησης κερδίζουν από διαφημίσεις αλλά έχουν συνήθως και χορηγούς(sponsors).

Οι μηχανές αναζήτησης διαρκώς ψάχνουν το Internet για λέξεις-κλειδιά σε σελίδες WWW, newsgroups, e-lists, email κτλ. Καταγράφουν τις λέξεις-κλειδιά και τις αντίστοιχες διευθύνσεις των σε μια βάση δεδομένων στο τοπικό υπολογιστικό σύστημά των. Όταν ο χρήστης αναζητήσει μια λέξη-κλειδί, η μηχανή αναζήτησης ψάχνει τη βάση δεδομένων της και επιστρέφει μια λίστα με τις διευθύνσεις των εντύπων (με μια σύντομη περίληψη των) όπου συναντάται η λέξη-κλειδί.

Κάθε μηχανή αναζήτησης επιστρέφει διαφορετικά αποτελέσματα γιατί χρησιμοποιεί διαφορετικό:

·     αλγόριθμο αναζήτησης

·     συχνότητα ενημέρωσης της βάσης δεδομένων της

·     μέγεθος βάσης δεδομένων

·     περιοχή αναζήτησης Web sites

·     σημεία αναζήτησης στις σελίδες (URL, επικεφαλίδα, κορμό εντύπου, σύνδεσμοι, κτλ.)

·     ταχύτητα αναζήτησης

·     ενδιάμεσο χρήστη

·     βαθμολογία αποτελεσμάτων

·     συσχέτιση σχετικών σελίδων

Σε πολλές μηχανές αναζήτησης μπορείτε να καταγράψετε και τις δικές σας WWW σελίδες. Έτσι όταν κάποιος κάνει μια αναζήτηση για λέξεις-κλειδιά που υπάρχουν στις σελίδες σας, η μηχανή αναζήτησης θα εμφανίσει και τις διευθύνσεις των σελίδων σας.

2. Μετα-εργαλεία Αναζήτησης (Meta Search Tools)

(Multithreaded Search Engines)

Η αύξηση των αριθμού των Μηχανών Αναζήτησης δημιούργησε την ανάγκη δημιουργίας εργαλείων που θα ψάχνουν τις βάσεις δεδομένων των Μηχανών Αναζήτησης ταυτόχρονα μέσω ενός κοινού ενδιάμεσου χρήστη. Έτσι αναπτύχθηκαν Μετα-εργαλεία Αναζήτησης που επιπλέον ταξινομούν τα αποτελέσματά τους βάσει επιπρόσθετων κριτηρίων.

Ο χρήστης μπορεί επίσης να επιλέγει ποιες Μηχανές Αναζήτησης θα συμπεριλάβει καθώς και να μετατρέψει κατάλληλα την ερώτηση του.

Oι meta-search engines είναι κατά κάποιο τρόπο απλοϊκές  στην ικανότητα τους να αποδίδουν αποτελέσματα που να έχουν μεγάλη σχετικότητα  με το θέμα που μας ενδιαφέρει.

 

Αναφορικά:

Φιλτράρει τα διπλά αποτελέσματα

Ψάχνει το infoseek, Excite, Altavista, Lykos, Web Crawler και Yahoo!. Tα αποτελέσματα εμφανίζονται  με σειρά σχετικότητας και οι διπλές συνδέσεις αφαιρούνται.

 

2.1 Ψάχνοντας μία Μηχανή Αναζήτησης

1. www.search.com

2. www.isleuth.com

Χρησιμοποιήστε αυτές τις τοποθεσίες για να διευκολυνθείτε στο να βρείτε μία μηχανή αναζήτησης καθώς υπάρχουν εκατοντάδες.

3. Θεματικοί Οδηγοί (Subject Guides)

Συνήθως τα αποτελέσματα των Μηχανών Αναζητήσεων  δεν είναι αυτά ακριβώς που ψάχνει ο χρήστης. Έτσι δημιουργήθηκε η ανάγκη για ανθρώπινη παρέμβαση στην επεξεργασία και συντήρηση των βάσεων δεδομένων. Οι Θεματικοί Οδηγοί είναι ιεραρχικά οργανωμένα ευρετήρια ανά θέμα που επιτρέπουν αναζήτηση λιστών Web sites ταξινομημένων ανά θέμα. Καθώς έχουν μικρότερη βάση δεδομένων, επιστρέφουν και λιγότερα αποτελέσματα που όμως είναι και πιο σχετικά με το θέμα αναζήτησης. Συνήθως επιστρέφουν την αρχική σελίδα των Web sites που περιέχουν σελίδες σχετικές με το θέμα. Οι Θεματικοί Οδηγοί είναι καλύτεροι για αναζήτηση γενικών θεμάτων.

 

4. Σπίτια Ξεκαθαρίσματος (Clearinghouse)

Όπως ένα Μετα-εργαλείο Αναζήτησης ψάχνει ταυτόχρονα σε πολλές διαφορετικές Μηχανές Αναζήτησης, έτσι και ένα Σπίτι Ξεκαθαρίσματος ψάχνει ταυτόχρονα πολλούς Εξειδικευμένους Θεματικούς Οδηγούς σε συγκεκριμένο θέμα.

 

5. Στρατηγικές Αναζήτησεις

Το πρώτο βασικό βήμα του χρήστη είναι να προσδιορίσει ακριβώς τις λέξεις-κλειδιά και πιθανά συνώνυμα που περιγράφουν το θέμα αναζήτησής του. Πολλές Μηχανές Αναζήτησης μπορούν να συνδυάσουν λογικά (AND, OR, NOT) ή με άλλο τρόπο (ADJACENT, NEAR, FOLLOWED BY, κτλ.) τις λέξεις-κλειδιά. Επίσης μπορεί να δεχθούν χαρακτήρες μπαλαντέρ (*,?) και επαναδιατύπωση της ερώτησης. Επιστρέφουν τα αποτελέσματα με βαθμολογία σχετικότητάς των ως προς τις λέξεις-κλειδιά και με συνδέσμους σε άλλες σχετικές σελίδες.

 

5.1. Τεχνικές αναζήτησης

          Οι μηχανές αναζήτησης ποικίλουν, αλλά οι τεχνικές που πρέπει να χρησιμοποιείτε για να πραγματοποιείτε αποτελεσματικές αναζητήσεις είναι περίπου οι ίδιες.

5.2. Απλή αναζήτηση

          Αν πληκτρολογήσετε μία μόνο λέξη, θα αναζητηθεί. Αν πληκτρολογήσετε δύο ή περισσότερες λέξεις, υπάρχουν οι εξής περιπτώσεις:

·     Οι πιο πολλές μηχανές αναζήτησης θα βρούν σελίδες που περιέχουν οποιαδήποτε από τις λέξεις αυτές, αλλά θα εμφανίσουν πρώτες αυτές που περιέχουν όλες ή τις περισσότερες από αυτές. Για παράδειγμα, η αναζήτηση ‘‘Los Angeles’’ θα βρει σελίδες που αναφέρουν την πόλη αυτή ανεξάρτητα από τον τρόπο γραφής της. Η αναζήτηση ‘‘Internet Chess Club’’ θα βρει όλες τις σελίδες που περιέχουν τη λέξη ‘‘Internet’’, συν αυτές που περιέχουν τη λέξη ‘‘Chess’’ συν αυτές που περιέχουν τη λέξη  ‘‘Club’’ - πρόκειται εκατοντάδες χιλιάδες σελίδες. Όμως  οι σελίδες που περιέχουν και τις τρεις λέξεις- όχι κατ’ ανάγκη με τη σειρά που τις πληκτρολογήσατε- θα βρίσκονται ανάμεσα στα πρώτα αποτελέσματα που θα εμφανιστούν.

·     Μερικές μηχανές θα εμφανίσουν μόνο τις σελίδες που περιέχουν  όλες τις  λέξεις που δώσαμε.

·     Αν οι λέξεις περικλείονται σε διπλά εισαγωγικά , οι περισσότερες μηχανές θα αναζητήσουν μόνον τη φράση που σχηματίζουν. Αν κάνετε την αναζήτηση ‘‘search engines’’ θα βρείτε σελίδες που αναφέρονται στις μηχανές αναζήτησης και όχι σε μηχανές π.χ αυτοκινήτων.

 

5.3. Προχωρημένη αναζητήση

          Οι αναζητήσεις αυτές γίνονται με την βοήθεια λογικών τελεστών με αποτέλεσμα να έχουμε έτσι περισσότερες δυνατότητες.

Λογικοί τελεστές

          Οι λογικοί τελεστές χρησιμοποιούνται για να συνδέσουν λέξεις-κλειδιά. Συνήθως γράφονται με κεφάλαια.

AND   πρέπει να βρεθεί κάθε μία από τις λέξεις.

OR      αν βρεθεί έστω και μία λέξη, η σελίδα θα περιληφθεί στα αποτελέσματα.

NOT   θα αγνοηθούν οι σελίδες που περιέχουν τη λέξη που ακολουθεί το ΝΟΤ.

Αν χρησιμοποιήσετε πολλούς τελεστές, θα ληφθούν υπόψη με τη σειρά ΝΟΤ, ΑND και κατόπιν OR. για παράδειγμα η αναζήτηση

          Cars  AND motors OR  boats

θα βρει σελίδες που αναφέρονται σε αμάξια και σε μηχανές ή  σε βάρκες. Η αναζήτηση

          expensive AND cars OR motors

θα βρει αναφορές σε ακριβά αμάξια, αλλά θα περιλάβει και τις σελίδες που αναφέρονται γενικά  σε μηχανές. Αυτό μπορεί να αλλάξει προσθέτοντας παρενθέσεις γύρω από το τμήμα της φράσης που θέλετε να υπολογιστεί πρώτο. Έτσι, για να βρείτε σελίδες για ακριβά αμάξια ή μηχανές , θα πρέπει να γράψετε:

          expensive AND (cars OR motors)

 

5.4. Χρήση Συμβολισμών

          Μερικές μηχανές επιτρέπουν τη χρήση των συμβόλων + (πρέπει να υπάρχει η λέξη) και - (δεν πρέπει να υπάρχει). Οι λέξεις κλειδιά που έχουν μπροστά τους το σύμβολο + θα πρέπει να περιέχονται σε μια σελίδα για να εμφανιστεί στο αποτέλεσμα, ενώ οι σελίδες που περιέχουν τη λέξη με το σύμβολο - θα αγνοηθούν. Για παράδειγμα, η αναζήτηση

          + ‘‘Garry Kasparov’’  - books

θα βρει σελίδες σχετικές με το σκακιστή Garry Kasparov , θα αγνοήσει όμως τις  σελίδες που αφορούν  σχετικά  βιβλία για το πρόσωπο αυτό.

 

6. Κατάλογος

Alta Vista         altavista.digital.com       (αναζητήσεις σε Web, newsgroups, ...)

AOL                home.aol.com/index.html

ArgusClearinghouse                  www.clearinghouse.net/searchbrowse.html

Businesseek      www.businesseek.com/

DejaNews        www.dejanews.com     (αναζητήσεις στα newsgroups)

Dogpile            www.dogpile.com

Dream              www.iti.gov.sg/iti_service/dream/dream_announce.html

Excite               www.excite.com           (αναζητήσεις σε Web & newsgroups)

Four11             www.four11.com

Galaxy              galaxy.einet.net

Go2                 www.goto.com/WWW.html

Highway61       www.highway61.com

HotBot             www.hotbot.com

Identify www.identify.com

Inference          m5.inference.com/ifind/

Infoseek           www.infoseek.com       (αναζητήσεις σε Web, newsgroups, e-mail ...)

Infopages         infopages.com/listings/

Lookup            www.lookup.com/lookup/search.html

Lycos               www.lycos.com

Magellan          www.mckinley.com

Maxonline        maxonline.com/searchstudy/

MetaCrawler    www.infospace.com/info.go2net/

MetaFind         www.metafind.com

MiningCo         www.miningco.com/

Navigate           www.navigate.net/

Netscape          www.netscape.com

Open Text        index.opentext.net

Pointcom          www.pointcom.com

SearchCom      www.search.com

Snoopie            www.snoopie.com

VirtualLibrary   vlib.stanford.edu/Overview.html

WebCrawler    webcrawler.com

Yahoo              www.yahoo.com

WWWSearch  www.pwc.k12.nf.ca/search.html

WWW Worm  www.cs.colorado.edu/wwww

 

 

7. Αναζήτηση προσώπων

Για αναζήτηση προσώπων, ο χρήστης μπορεί να χρησιμοποιήσει τις παραπάνω μηχανές αναζήτησης. Επιπλέον υπάρχουν και πιο εξειδικευμένα εργαλεία όπως

FAF                             www.ais.net/findafriend

Helpdesk                      www.webmart.com/the_helpdesk.html

IAF                              www.iaf.net/frames/body/main.html

Infospace                     206.129.166.101/people.html

Internic             ds.internic.net

usenet-addresses          usenet-addresses.mit.edu

WHO’sOn-line             www.ictp.trieste.it/Canessa/whoiswho.html

Whowhere                   www.whowhere.com

WWDirectory Service www.cse.bris.ac.uk/comms/ccrjh/search-form-world.html

WED                           www.wordemail.com/wede-4a.shtml

 

8. Εύρεση εργασίας  (employment, careers, jobs)

 

Στο Internet υπάρχουν αρκετά  WWW sites που προσφέρουν υπηρεσίες ευρέσεως εργασίας. Το WWW δεν είναι μόνο χρήσιμο για την απόκτηση γνώσης αλλά και στην εύρεση εργασίας.

ACM                              www.acm.org/acm/carreropps/

CareerMagazine               www.careermag.com

CareerMosaic                  www.careermosaic.com

CareerSite                       www.careersite.com

Espan                              www.espan.com

Jobnet                             www.jobnet.com

Jobsite                            www.powerjobs.com

Lendman                         www.lendman.com

NOVA                            www.nova.edu/Inter-Links

Online Career Center       occ.com

PrincetonReview             www.review.com

 

9. Oργανισμοί

Οι παρακάτω διευθύνσεις οργανισμών στο Internet περιέχουν χρήσιμες πληροφορίες για διάφορα θέματα

  • IEEE                                        www.ieee.org

  • IEEE Computer                        computer.org

  • ACM                                        www.acm.org

  • ITU                                          www.itu.int

  • IFIP                                         www.ifip.or.at

  • W3                                           www.w3.org

  • INFORMS                               mat.gsia.cmu.edu   & www.informs.org

  • ECHO(TELEMATICS, etc.)     www2.echo.lu

  • CORDIS(ESPRIT, etc.)           www.cordis.lu

  • ESPRIT                                   www.newcastle.research.ec.org

  • ACTS                                                www.infowin.org/ACTS/  

  • TERENA                                 www.terena.nl 

  • EUROPA                                 www.europa.eu.int

  • PTC                                         www.ptc.org

  • NSF                                         www.ehr.nsf.gov

  • Interop                                     www.interop.com

  • Εθνικό Κέντρο Τεκμηρίωσης  www.ekt.org.gr

  • Γεν. Γρ. Έρευνας & Τεχνολ.   www.gsrt.gr                   

  • Forthnet                                   www.forthnet.gr

 

10. Ηλεκτρονικές Λίστες (e-lists)

Οι ηλεκτρονικές λίστες είναι λίστες με ηλεκτρονικές διευθύνσεις ανθρώπων με κοινά ενδιαφέροντα. Υπάρχουν πάνω από 2500 ηλ. λίστες στο Internet. Στις ηλ. λίστες, οποιοσδήποτε από τους συμμετέχοντες μπορεί να στείλει μήνυμα στην κεντρική διεύθυνση, και αυτό το μήνυμα αναμεταδίδεται σε όλους τους συμμετέχοντες. Δηλαδή, όσοι συμμετέχουν σε κάποια ηλ. λίστα λαμβάνουν αυτόματα το ηλεκτρονικό μήνυμα που στέλνει κάποιος στην ηλ. λίστα. Έτσι μπορεί να διαβάζει τα μηνύματα που στέλνονται, να θέτει ερωτήσεις, να απαντά σε ερωτήσεις κτλ.

Ο συνηθισμένος τρόπος εγγραφής σε κάποια από αυτές τις ηλ. λίστες είναι να στείλετε ηλεκτρονικό ταχυδρομείο: 

  • mail subscription_address

 

όπου στο κυρίως τμήμα του μηνύματος σας θα γράφετε:

  • subscribe listname  το όνομα σας

 

Όταν θελήσετε να διαγραφείτε από την ηλ. λίστα, στέλνετε το μήνυμα:

  • unsubscribe listname

Αναφορικά:

Βοηθούν στο να βρούμε mailing lists ανά θεματική ενότητα.

 

Καλύπτει εκτεταμένα οτιδήποτε σχετικό με λίστες.

 

Καλύπτεί οτιδήποτε αφορά τα newsgroups

 

Στις παρακάτω σελίδες WWW υπάρχουν σύνδεσμοι προς e-lists διαφόρων θεμάτων

 

10.1. Όνομα ηλεκτρονικής λίστας

                                                 

  • aecm-l                   Accounting Education using Computers& Multimedia

  • big-lan                   Campus-size LANs        

  • buscom-l               Business Communications

  • buslib                    Business Library

  • ccmi-l                    Telecommunications Managers

  • cis-l                       Careers in Information Systems

  • com-priv               Communications Private

  • data-protection      Data Protection

  • edi-l                      Electronic Data Interchange - EDI      

  • firewalls                 Security Firewall Systems

  • imall-chat               Internet Maill        

  • info-gnu-msdos     GNU S/W

  • info-nets                InterNetworking    

  • info-pc                  PC Users

  • internet-sales          Internet Sales                                                                           

  • jobplace                Management of Microcomputer Labs

  • netadmin               Managers of Regional Library Networks

  • pctech-l                 PC Users

  • sneakers                Testing Security Systems                   

  • tbtf                        Commerce on the Internet        

  • uninfsec                University Security Issues

  • virus-l          Computer Virus Issues             

  • web-support          WWW browsers, servers, languages, etc.

  • web4lib                 Library-based WWW servers & clients

  • www-html             HyperText Markup Language

  • www-managers      Managers of WWW servers

  • www-proxy           WWW proxies, caching, servers

  • www-rdb               Relational DataBases into WWW

  • www-security        Security of WWW servers

  • www-speed           WWW performance

  • www-talk               WWW S/W

  • www-vrml              Virtual Reality Markup Language