Bruk av Internett

Forelesningsnotat for forelesingane tysdag 26. august og fredag 29. august 1997.

Kva er Internett?

Internett kan i første omgang sjåast på som ei samling datamaskiner som er å finne i nesten alle land i heile verda. Det desse maskinene har felles som gjer at dei til saman lager eit nett, er at dei er knytte saman med kommunikasjonsliner og at dei har dei same kommunikasjonsprotokollane. Dette siste tyder at maskinene 'snakkar same språk' og dermed kan kommunisere, utveksle informasjon. At maskinene kan kommunisere betyr også at brukarane av maskinene kan kommunisere seg i mellom på mange ulike måtar. Det er mange som vel å sjå på desse brukarane som Internettet, og definerer Internett som den samlinga av menneske som kan kommunisere med kvarandre på denne måten.

Internett blei i starten etablert for å eksperimentere med datakommuikasjon ved undervisnings- og forskingsinstitusjonar i USA. I mange år var det berre ikkje-kommersielle institusjonar som hadde lov å koble seg til nettet, og framleis i dag er Internett dominert av brukarar frå undervisning og forsking. Dette gjeld også i Noreg, for her sørga Kirke-, utdannings- og forskningsdepartementet for at universitet og høgskular fekk gratis tilgang til nettet tidleg på 90-talet. Organisasjonen Uninett i Trondheim vart oppretta for å gjennomføre dette i praksis. Uninett har framleis dei same oppgåvene, men finansieringa skjer no ved innbetalingar direkte frå medlemsorganisasjonane, og ved sal av tenester.

Drifta av nettet og fordelinga av kostnadane med å drive det blir gjort som ei form for dugnad. Kvar institusjon tek ansvaret for drifta og kostnadane for sine eigne maskiner og kommunikasjonslinjene til ein eller fleire naboinstitusjonar.

Talet på maskiner som er knytte til nettet er no (august 1997) oppe i omlag 19,5 millionar. Dette talet stammar frå Internet Domain Survey, og den definisjonen som dei brukar for å avgjere om ei maskin er på Internett eller ikkje er omlag den same som står i Tanenbaum på side 53. Det er ikkje like enkelt å avgjere kor mange brukarar nettet har, for det vil variere sterkt med korleis ein definerer ein brukar. Ein brukar kan vere alt frå ein som har ei e-post adresse som han ikkje brukar, til ein som brukar mange tenester på nettet fleire timar pr. dag. Tilgang til nettet er i dag bokstavleg tala hyllevare, og det er svært billeg for ein privatperson som alt har personleg datamaskin å ta det i bruk.

Nokre punkt frå historia om Internett

Du kan finne fleire hovudpunkt i historia om Internett i det som blir kalla Hobbes' Internet Timeline

Kva kan vi bruke Internettet til?

Dette med teknikken er vel og bra, men viktigare for oss her og no er å finne ut kva vi kan bruke dette store og fine nettet til. I første omgang kan vi dele opp tenestene i to ulike bruksområde: Dei ulike måtane å bruke nettet på kallar vi for tenester, og til kvar teneste fins det mange ulike verkty (=program) for mange ulike plattformer (=maskiner og operativsystem).

Elektronisk post, e-post og diskusjonsgruppene i News er dei viktigaste tenestene for kontakt med andre brukarar, og desse tenestene bygger på at brukarane kan utveksle elektroniske meldingar.

WWW og Gopher er namna på tenestene for å distribuere informasjon. Tenestene bygger på klient/tenar-modellen, der brukaren bruker eit klientprogram til å ta kontakt med tenermaskiner som har informasjon som er tilrettelagt for denne type bruk.

ftp er namnet på tenesta for å overføre filer på Internett. ftp kan sjølvsagt brukast til å overføre alle slag filer, men utveksling av programvare er eit viktig bruksområde.

Vi skal no ta for oss desse tenestene etter tur, og beskrive dei i meir detalj.

Elektronisk post

Elektronisk post er den mest kjende og mest vanlege måten for å kommunisere med andre brukarar av Internett. Som du sikkert kjenner til så er elektronisk post i si enklaste form det å sende meldingar frå ein brukar til ein annan. Ei melding er i si enklaste form nokre få liner med tekst som blir skrive på ein dataskjerm og utstyrt med eit meldingshode som fortel kven den skal sendast til, kven den kjem frå og kva den handlar om. Her ved HiÅ bruker dei fleste programmet Eudora for Windows til å skrive og lese e-brev.

Adresser

Før du kan sende eit elektronisk brev til ein annan må du kjenne adressa til den elektroniske postkassa hans. I vanleg bruk i dag er det to typer adresser: Internett og X.400.

Strukturen på Internettadresser er brukar@maskin.domene brukar er namnet på brukaren eller på den kontoen han har på maskina. domene fortel som oftast noko om kva organisasjon han tilhøyrer til eller kvar han har abonnement som privatperson. Siste delen av domene-namnet er anten ein landskode eller ei forkorting som fortel kva type organisasjon det er tale om.

X.400 adressene er om mogeleg endå meir kryptiske. Dei har faste felt, og adressene blir ofte skrivne med feltkodane med semikolon som skiljeteikn. G=Fornamn;S=Etternamn;O=organisasjon;PRMD=postkontor; ADMD=hovedpostkontor;C=land; Dersom du har eit godt program for å sende og motta e-post så slepp du å sjå desse kodane, og kan nøye deg med å bruke namnet på den du skal sende til.

Det neste spørsmålet som naturleg dukkar opp er: Korleis skal eg finne fram til adressene til dei eg kjenner? Og svaret på det er at det kan du finne ut på mange ulike måtar. Det raskaste, sikraste og enklaste er framleis at du brukar telefonen og ringjer til den det gjeld og spør. Ellers vil du via andre tenester f.eks news kome i kontakt med mange som du berre kjenner via Internett. Det fins også databaser over personer som har elektronisk postboks, og dei er søkbare over Internett og via e-post. Ved å sende ei melding med eit søkebegrep til ein slik database kan du få eit automatisk svar attende. I Norge har både UNINETT og TelePost Communication slike databaser: Adressene er: directory@uninett.no og katalog@telepost.telemax.no Ulempa med desse katalogane er at dei er baserte på at brukarane sjølve registrer seg. Det har derfor lett for å bli tilfeldig kven som er med og det er også tilfeldig om adressene i basen blir oppdaterte ved endringar.

Informasjonsfiler om e-post og adresser fins sjølvsagt på nettet. Ei av dei viktigaste er: FAQ: How to find people's E-mail addresses.

X.400 og Internet

X.400 og Internett er eigentleg separate nett for utveksling av e-post, men det er etablert samtrafikk mellom dei. I Norge er det Telepost som har ein såkalla 'gateway' som konverterer formatet på meldingane og utvekslar dei mellom netta.

Distribusjonslister

Det er ofte behov for å sende den same meldinga til mange brukarar. Det blir gjort ved distribusjonslister. Listene kan vere lagra enten i e-post programmet ditt, eller på ein server som syter for at alle meldingar som kjem til lista blir sendt til alle som er på lista.

E-post til andre tenester

Mange av dei andre tenestene på Internett kan brukast ved å sende e-post meldingar til program som svarer automatisk. Du kan f.eks få tilgang til både news, ftp og archie på den måten. Sjå nedanfor for detaljar om dei andre tenestene.

Usenet News

Usenet News eller berre News er ikkje som ein kanskje skulle tru av namnet ei nyheitsteneste på Internett, men derimot eit globalt diskusjonsforum. Også i news blir elektroniske meldingar sendt mellom brukarane, men her er strukturen at ein bruker sender til mange andre brukarar. News er organisert i diskusjonsgrupper og kvar slik gruppe representerer eit tema. Alle som er interessert i det temaet abonnerer på gruppa, og dermed kan dei lese meldingane som dei andre brukarane med same interesser skriv. Her ved HiÅ kan vi no lese mellom 5000 og 6000 diskusjonsgrupper. På verdsbasis fins det over 15000 grupper, men mange av dei er nasjonale og all diskusjon foregår på eit framandt språk.

Tema organisert i eit hierarki av grupper

Gruppene er organisert hierarkisk. Eit eksempel er f.eks gruppa comp.sys.amiga.hardware. Her står forkortinga comp for at dette er ei gruppe som har med databehandling og datamaskiner å gjere, sys for dei ulike datasystema, amiga for amiga-system og hardware for at dette har med maskinvare til Amiga-system å gjere. Sjølv om strukturen liknar så må vi ikkje forveksle namn på News-grupper med maskinnamn.

Usenet er på ein måte større enn Internett, for Usenet News blir distribuert til fleire maskiner enn dei som utgjer Internett. Mange ulike teknikkar blir brukt for å distribuere News. Både UUCP over oppringte telelinjer og kopiering via magnetisk tape blir nytta.

Det blir ofte utveksla meldingar mellom News grupper, diskusjonsforum på BBSer og e-post-lister. Dette skaper ofte ein del tekniske problem med inkompatible meldingsformat, men også sosiale problem mellom ulike brukergrupper som er vane med å bruke sitt system på sin måte.

Eit eksempel på dette er koplinga mellom Slektsforum BBS og Newsgruppa no.slekt. BBSen vart etablert først og seinare kopla saman med no.slekt. Etter ei tid kom det sterke klager frå no.slekt-sida på at BBS-brukarane ikkje følgde reglane for Usenet.

Dei åtte store

Dei viktigaste toppnivåa i News-hierarkiet er:

Desse går under namnet "Dei åtte store" og gruppene under desse hattane er den mest offisielle delen av News-systemet. Det som er spesielt med dei er at dei er internasjonale og blir distribuert over heile verda. Eit anna viktig fellestrekk er at her er det reglar for når nye grupper skal opprettast og gamle fjernast. Det blir sendt ut spesielle meldingar med spesielle namn når slike endringar er på gang: RFD (Request for discussion) er eit forslag til endring og oppfordring til diskusjon. Medan CFV (Call for votes) er ei oppfordring til å avgi stemmer for eller imot den foreslåtte endringa. Avstemminga foregår via e-post, og ein nøytral friviljug står for oppteljinga. Det fins detaljerte reglar for kor mange som må stemme og kor stor del som må være for forslaget for at det skal bli sett i verk.

Andre hierarki

alt - er det alternative hierarkiet. Her er det ingen regler for kva som må til for å opprette ei diskusjonsgruppe. Alle som kan dei tekniske detaljane kan gjere det. Etterkvart har det likevel blitt litt struktur, for det er den som er ansvarleg for ein news-server som bestemmer kva for grupper han vil tilby til sine brukarar.

no-hierarkiet er diskusjongrupper på norsk. Og dette kan vere ein fin stad å starte med å bruke news. Ein slepp då å slite med språkproblem samstundes med at ein tek i bruk eit nytt medium.

Spesielle grupper

Nokre få grupper er det verd å seie litt meir om no. news.anounce.newusers inneheld meldingar som nye brukarar bør lese før dei sender noko ut på nettet, og dei andre brukarane forventar at vi gjer det.

Dei fleste av dei gode newsgruppene har såkalla FAQ-filer eller annan informasjon som blir sendt ut periodisk, f.eks ein gong i månaden. Gruppa news.answers er gruppe som er spesielt meint for slik informasjon som kjem omatt og omatt. Alle som postar periodisk informasjon blir tilrådd å poste det i denne gruppa i tillegg til den gruppa det eigentleg høyrer heime.

Støy

Det er ofte vanskeleg å finne tak i den informasjonen som har høg kvalitet i News, for det er svært mykje utanomsnakk i diskusjonane. Men dette er problem som brukarane av News stendig prøver å arbeide med. Dei vanlegaste måtane for å handtere støyen er:
FAQ-filer
FAQ er ei forkorting for Frequently (eller First) Asked Questions. FAQ-filer er filer eller meldingar med svar på spørsmål som dukkar opp igjen og igjen. Dei blir posta regelmessig, eller det blir sendt ut ei melding som viser til kvar FAQ-fila er å finne. FAQ-filene blir gjerne til ved at ein aktiv brukar tek på seg å vere redaktør og at mange hjelper til med å sende relevante spørsmål og svar til denne redaktøren. Alle som får svar på eit spørsmål i News blir oppfordra til å poste eit samandrag av svara i ei eiga melding, og svært ofte er slike samandrag også eigna til å vere med i FAQ-fila. FAQ-filer kan ofte vere betre som introduksjon til eit fagområde enn mange lærebøker i det same emnet.
Netiquette
Nettiquette er ei samandraging av net og etiquette og det handlar om reglar for korleis ein skal samarbeide med dei andre brukarane av News. Dei viktigaste reglane er:
Verktøy for News-lesing
Gode Newsprogram er viktig for å kunne utnytte systemet fullt ut. Dei viktigaste skilnadane på gode og dårlege newslesarar er:

Gode program har avanserte funksjonar for å søkje både i newsgrupper og i meldingane i ei gruppe. Dei avanserte programma kan også sortere meldingane på ulike måtar, etter emne, etter dato eller etter forfattar.

Ein annan viktig funksjon er den såkalla Kill-fil. Det betyr at brukaren kan sortere ut forfattarar eller emne som han ikkje ynskjer å lese.

uuencode / uudecode

Newgrupper blir også brukte til å distribuere datafiler. Ofte er dette programvare eller f.eks bilder som er ganske populært. Sidan Usenet berre garanterer at meldingar med 7-bits ASCII blir overført korrekt, må innhaldet i binærfilene kodast om. Dette blir oftast gjort med ein teknikk som kallast uuencode/uudecode. Dei beste leseprogramma for news handterer denne omkodinga automatisk, og vi kan enkelt både sende og motta datafiler med funksjonane i programmet.

Filoverføring med FTP

FTP er namnet på protokollen for overføring av filer på Internett. FTP er også det vanlegaste namnet på programmet som køyrer den protokollen. Anonym FTP er ei teneste på Internett. Anonym FTP betyr at du kan hente filer frå maskiner på nettet ved å bruke ein velkjent konto som ikkje er stengt med passord.

Store arkiv med filer blir på denne måten gjort gratis tilgjengeleg for oss som er brukarar av nettet. Oftast blir det gjort ved gratis innsats frå ein del organisasjonar. Det at det er gratis kan synast som ei stor fordel i første omgang, men det har også den ulempa at ingen er forplikta til å drive denne tenesta, og dermed kan ditt favorittarkiv forsvinne så og seie over natta.

Det å logge seg inn på ein FTP-server foregår på same måten som når ein loggar seg inn på ei anna fleirbrukar maskin. Brukaren må oppgi brukarnamn og passord, men for FTP så er brukarnamnet alltid det same og passordet noko ein bruker til å legge att eit lite visittkort:

User: anonymous
Passord: kt@hials.no
Det er viktig å ikkje prøve anonym FTP mot andre maskiner enn dei som på ein eller annan måte er annonserte som åpne for anonym FTP. Å prøve mot ei vilkårleg maskin, kan bli oppfatta som eit forsøk på datainnbrot.

Kva kan vi få tak i?

Der er store mengder med gratis og fritt distribuerbar programvare tilgjengeleg på nettet. Dei viktigaste kategoriane er:
Gratis program for UNIX-plattformer
I denne kategorien finn vi både ferdig kompilerte program og kildekode. Alt frå komplette operativsystem og avanserte teksbehandlingssystem til små enkle spel og hjelpeprogram. Gode eksempel er operativsystemet Linux, kopilatorar og andre utviklingsverkty som er utvikla i Gnu-prosjektet og tekstbehandlingssystemet TeX.

UNIX og Internett har levd i tett symbiose i over 25 år. Begge deler har hatt størst utbreiing i undervisnings- og forskingsmiljø. Desse miljøa har vore meir prega av deling av både informasjon og programvare enn av kjøp og sal. Typiske eksempel her er at UNIX i ei tidleg periode blei 'gitt bort' av AT&T til alle universitet som ville ha det. Berkley Universitet var ein av mottakarane og dei brukte UNIX til å eksperimentere med kommunikasjon på Internett. Dei implementerte TCP/IP-protokollane i sin UNIX-variant og denne UNIXen blei i sin tur også 'gitt bort'. Dermed fekk Internett hurtigare spreiing i dei same miljøa.

Hjelpeprogram for DOS og Windows
Det fins mange program i denne kategorien, men dei har svært varierande kvalitet.
Shareware og demoversjoner av PC-programvare
Fritt distribuerbar programvare blir kalla shareware. Det typiske er at eit program blir distribuert fritt i første versjon, for at det skal få stor utbreiing. Men at det så dukkar opp ein kommersiell versjon på eit seinare tidspunkt. Typiske eksempel er både Eudora og Netscape.

Korleis finne namn på maskiner og filer?

For å bruke FTP, må vi vite namnet på ei maskin som er opa for anonym FTP, og det er ein fordel om vi også veit namnet på den fila vi skal ha tak i og kva katalog ho ligg i. Det er fins ulike måtar for å finne fram til slike opplysningar. Ved å lese FAQ-filer eller stille spørsmål i relevante News-grupper, vil ein svært ofte finne nøyaktige referanser til det ein er ute etter.
Strukturen på ein typisk server
Det du oftast vil møte på ein FTP-server er eit UNIX-filsystem. Det betyr at katalogstrukturen og filnamna er i samsvar med det som er lovleg på ei UNIX-system. / blir brukt til å angi skiljet mellom ein katalog og ein underkatalog. /pub er eit vanleg namn på katalogen som inneheld alt som er fritt tilgjengeleg.

På mange av serverane fins det eigne filer med oversikt over alle filene som er tilgjengelege. Desse filene har ofte namn som INDEX eller 00INDEX, og det kan gi fin oversikt å bla litt i ei slik fil. INDEX-filene kan dekkje heile servaren eller berre ein katalog.

Archie
archie er namnet på ein database over filnamn på opne ftp-serverar. Vi kan bruke archie til å søkje etter filer og program, og vi får ut informasjon frå databasen om kva server som har fila og kvar på servaren ho ligg. Vi kan få tilgang til archie på mange måtar: Det er viktig å sjekke kvaliteten på det resultatet du får frå eit søk i archie. Du vil finne informasjon om datoen på filene og om når det sist blei levert informasjon om FTP-servaren til archie.
Informasjon om FTP i News
Det fins mykje informasjon om FTP i News. Mellom anna så fins det ein eigen FTP FAQ og lange lister over åpne FTP arkiv.
Velkjende arkiv
Det fins nokre store og velkjende FTP-arkiv som det kan vere bryet verdt å merkje seg namna på:
Speiling av ftp-serverar
Dei mest populære serverane har ofte såkalla 'mirror-sites' i andre deler av verda. Dette blir gjort for å avgrense trafikken på dei oversjøiske sambanda og for å auke tilgangen. Speil-servarar vil innehalde dei same filene som originalen, men det kan ta litt tid før dei siste nye filene er på plass.

Eit eksempel på eit slikt speil er maskina olivaw.dc.luth.se som i katalogen /pub/msdos/ftp.cica.indiana.edu-mirror/ har eit speil av CICA.

Komprimering av filer

For å gjere det enklare å hente filer og får å spare kapasitet i nettet, blir filer som ligg på FTP-servarane gjerne komprimerte og pakka inn i arkivfiler. Desse arkiva er oftast lette å kjenne igjen ved at siste delen av filnamnet viser kva slags arkiv det er snakk om. Dei vanlegaste arkivformata er: Alle komprimerte filer og arkiv må overførast i FTP som 'binary'. PKZIP versjon 2.04g er den nyaste eg kjenner til.

Problem med FTP

FTP-protokollen kan overføre filene anten som ascii-filer eller som binary-filer. ascii bør brukast på alle tekstfiler. FTP-programma vil då konvertere teiknsettet og tilpasse CR/LF kombinasjonane slik at det passer med det systemet filene blir overførte til.

FTP-serverar er i dei fleste tilfelle UNIX-maskiner, og filnamna fylgjer regler og konvensjonar for det systemet. Lovlege filnamn under DOS/Windows er svært avgrensa i høve til kva som er lovleg under UNIX. Det er ingen strenge reglar for lengda på filnamn under UNIX, det er skilnad på store og små bokstavar og fleire spesialteikn er lovlege i filnamna. For å bli lagra på ei Windows-maskin, må filnamna difor ofte forkortast og endrast. Dei ulike FTP programma for PCar handterer dette ulikt. Dei mest primitive vil gjere feil, og f.eks forsøke å lagre fleire filer med det same namnet og dermed misse nokre. Meir avanserte verktøy vil spørre brukaren om nye filnamn når konflikter oppstår, medan atter andre uten å spørre genererer nye unike filnamn.

Gopher

Gopher er ei teneste for å hente informasjon frå nettet. Informasjonen må være tilrettelagt for Gopher på førehand. Gopher bygger på klient - tenar prinsippet der brukaren har ein klient som kan ta kontakt med Gopher- servarar.

Informasjonen i Gopher tenesta er organisert i klikkbare menyar. Eit val i ein meny kan vere ei adresse til ei fil, til ein katalog på same servar eller til ein katalog på ein annan server. Dette er det same hypertekst prinsippet som vi finn i WWW. Sjå nedanfor!

Gopher tenesta er no ikkje lenger så populær fordi WWW fyller det same behovet på ein mykje meir elegant måte. Det fører til at svært mykje av informasjonen i Gopher ikkje lenger blir oppdatert. Du må difor vere svært kritisk til den informasjonen du finn med Gopher.

Veronica

Veronica er databasen over alle sidene i Gopher-tenesta. Veronica har den same funksjonen i Gopher som archie har i FTP.

WWW

WWW er ei forkorting for det engelske omgrepet World Wide Web. WWW-tenesta liknar mykje på Gopher, men grensesnittet som brukaren får presentert er meir fleksibelt og elegant. Prinsippet er hypertekst: Når du les ein tekst så kan nokre av orda vere utheva og ved å peike og 'klikke' på desse orda med musa vil du få presentert ny informasjon. Adressene som ligg bak dei aktive orda kan vere til ei vilkårleg fil på ein vilkårleg servar i WWW.

WWW gjer at vi kan få overført og framvist tekst og bilder med det same verktyet. Det er også mogeleg å få overført og avspela lyd- og videofiler, men kapasiteten på nettet dei fleste stader gjer at det tek lang tid å få sett eller høyrt det du ynskjer.

WWW tek opp i seg andre tenester

Informasjon som tidlegare berre var tilgjengeleg som f.eks FAQ-filer i News, blir no i stor grad konvertert til HTML som er formatet til filene i WWW.

Klientprogramma i WWW, dei såkalla browserane, integrerer også tenestene på den måten at dei same programma kan køyre alle dei ulike protokollane, og du kan nesten utan å merke det navigere fritt mellom WWW, Gopher, FTP, News og e-post.

Bokmerke, søkemaskiner og emnetre

Å finne fram i den enorme informasjonsmengda i WWW er ei stor utfordring, men funksjonane i programma og avanserte tenester på nettet er til stor hjelp.

Programma har funksjonar for å lagre adresser. Dette kallar vi gjerne bokmerke, og det er ein effektiv måte for å lage seg ei personleg samling av interessante 'stader'. Når du har funne ei viktig side som du vil komme attende til en annan gong, set du eit bokmerke. Neste gong du skal lese det samme er det berre å leite det fram i menyen over bokmerke.

Adressene som blir brukt i WWW har vist seg å ha nokre ulemper. Adressa http://www.hials.no/~kt/index.html viser til ei særskild fil i ein særskild katalog på ei særskild maskin. Det er for lite fleksibelt, for Internett er i stadig endring, og filer og katalogar blir flytta rundt. Vi støyter derfor stadig på adresser som er feil, og når noko blir flytta på, blir også bokmerka våre feil. Det er derfor lurt å avgrense bokmerka til dei 'stadane' som du er innom ofte.

Det du må ha med i lista din over bokmerke er dei viktigaste søkjemaskinene. Det er stader i WWW som systematiserer de andre sidene. Desse stadane inneheld vanlegvis ikkje sjølve informasjonen, men dei har store samlingar med peikarar til annan informasjon. Peikarane blir gjerne ordna tematisk og i ein hierarkisk trestruktur. Dette kallar vi då eit emnetre. Ein annan måte er altså å gjere peikarane søkbare, og det kallar vi ei søkjemaskin. Ofte er begge desse funksjonane tilgjengelege på dei same sidene.

I Norge er Origo - Index (Telenor Media) og Kvasir (Schibstednett) de to viktigaste søkjemaskinene. Internasjonalt er Yahoo og Alta Vista populære, men det fins også mange andre.

Innlogging på andre maskiner med telnet

telnet er ei teneste for å kome i kontakt med andre maskiner på nettet for ulike formål. For å logge seg inn på ei anna maskin må ein ha ein personleg konto på den maskina, eller kjenne til ein konto eller ei teneste som er open for alle. telnet gir brukaren eit primitivt grensesnitt med berre bokstavar på skjermen, og det er best egna til interaktiv bruk.