A META elemek egyik felhasználása az, amikor a keresőrendszereknek adunk információkat. Ugyanis a WWW-en működő legtöbb keresőrendszer már felhasználja a <META> tagban definiált információkat. Ez azért jó, mert oldalainkat nagyobb eséllyel találják meg azok, akik valamilyen téma, vagy kulcsszó szerint keresnek a Weben.
A <META> taget a dokumentum elején a <HEAD> és </HEAD> tagek közé érdemes elhelyezni.
2-10 szót használj, beépítve a legfontosabb keresőszavakat.
Ne használd a Home, Welcome szavakat és cégneveket.
A legtöbb keresőrobot a TITLE tagot úgy vizsgálja, mint a KEYWORDS tagot.
Fontossága: ajánlott
Az oldal tartalmának leírása röviden. Gyakran ezt a szöveget jelenítik meg a keresők a találati oldalon oldalad leírásaként.
Maximális hossza: 200-256 karakter
Tanácsos a szövegbe bekombinálni a legfontosabb keresőszavakat is.
Ha külföldi kerezőket is megcélzol, ill. oldalad tartalma ezt indokolja, kiegészítedhed így is:
<META name="DESCRIPTION" lang="HU" content="...">
Így a külföldi keresők találati oldalán a saját nyelvén jelenik meg az oldalad leírása
A oldal tartalmára jellemző kulcsszavak, amiket a keresőkbe beírva a kereső oldalunkat is meg kell találja.
Maximális hossza: 200/1000 karakter
Ne írj túl sok keresőszót. A keresőrobotok csak azokat a szavakat akceptálják, amelyek előfordulnak az oldal szövegében, vagy az oldalhoz kapcsolódó linkekben. Ne használj egy keresőszót többször, legfeljebb eltérő írásmóddal és a felforolásban egymástól távolabb. A keresőrobotok a hibákat spamkísérletnek tekintik és oldalad kizárásával díjazhatják.
Ha külföldi kerezőket is megcélzol, ill. oldalad tartalma ezt indokolja, kiegészítedhed így is:
<META name="KEYWORDS" lang="HU" content="...">
Lehet olyan keresési opciójuk, ahol egyes nyelveket preferálni lehet a kereséshez.
Fontossága: ajánlott
Ezzel az elemmel lehet beállítani, milyen karakterkészletet használjon a kliensgép böngészője az oldal megjelenítésekor. Ha az adott karakterkészlet nincs a gépen telepítve, az alapértelmezett karakterkészletét fogja használni. Csak egy karakterkészletet lehet kijelölni.
Íme a gyakrabban használt karakterkészletek:
iso-8859-1.....nyugat-európai [iso] iso-8859-2.....közép-európai [iso] > ajánlott iso-8859-4.....balti [iso] iso-8859-5.....cirill [iso] iso-8859-6.....arab [iso] iso-8859-7.....görög [iso] iso-8859-8.....héber [iso-visual] iso-8859-9.....török [windows] |
windows-1250.....közép-európai [windows] windows-1251.....cirill [windows] windows-1253.....görög [windows] windows-1255.....héber [windows] windows-1256.....arab [windows] windows-1257.....balti [windows] windows-1258.....vietnami [windows] |
Fontossága: ajánlott
Ez az elem a robotok oldalkövetését és oldalindexelését irányítja. Négy módon lehet ezt az elemet alkalmazni. A meta tag CONTENT szekciója az alábbi értékeket veheti fel (több értéknél vesszővel elválasztva):
Használható még az ALL = INDEX,FOLLOW, és a NONE = NOINDEX,NOFOLLOW érték is.
Robots Meta Tag Példák:
<META name="ROBOTS" content="INDEX,FOLLOW"> <META name="ROBOTS" content="NOINDEX,FOLLOW"> <META name="ROBOTS" content="INDEX,NOFOLLOW"> <META name="ROBOTS" content="NOINDEX,NOFOLLOW">
Fontossága: ajánlott
Itt határozhatod meg, hány nap múlva látogassa meg oldaladat a keresőrobot újra frissítések után kutatva. Csak ilyen elem a használatával biztosíthatod a változások keresők általi nyomon követését. Nem minden keresőrobot hajtja végre ezt a parancsot.
Fontossága: kevésbé fontos
Ezzel az elemmel is azt határozhatod meg, hány nap múlva látogassa meg oldaladat a keresőrobot újra frissítések után kutatva. Csak ilyen elem a használatával biztosíthatod a változások keresők általi nyomon követését. Nem minden keresőrobot hajtja végre ezt a parancsot.
Fontossága: kevésbé fontos
Itt lehet a lap szerzőjének a nevét megadni.
Fontossága: nem szükséges
Itt lehet a dokumentum készítésének idejét megadni.
Fontossága: nem szükséges
Itt lehet a dokumentum tartalmának copyright (szerzői jogi) adatait megadni.
Fontossága: kevésbé fontos
Itt adható meg infó a publikáló intézményről.
Maximális karakter: 64
Fontossága: nem szükséges
Itt adható meg a szerző email címe.
Fontossága: nem szükséges
Itt adható meg a reply email címed.
Fontossága: nem szükséges
Itt a készítéskor használt webszerkesztő szoftver neve adható meg. Számos webszerkesztő szoftver ezt a sort automatikusan hozzáfűzi a forráskódhoz.
Fontossága: nem szükséges
Meghatározhatod weblapod témáját. Egyes keresőknek segít az adatbázisában a megfelelő téma-kategóriába besorolni lapodat. A PAGE-TOPIC-al egyenértékű.
Fontossága: kevésbé fontos
Meghatározhatod weblapod témáját. Egyes keresőknek segít az adatbázisában a megfelelő téma-kategóriába besorolni lapodat. A SUBJECT-el egyenértékű.
Fontossága: kevésbé fontos
Itt meghatározhatod dokumentumod típusa. Pl: "Privat Home Page"
Fontossága: nem szükséges
Itt adhatod meg, milyen látogatói rétegnek szól a dokumentum. Pl: "ALL, CHILDREN, YOUNGS, SENIOR"
Fontossága: kevésbé fontos
RATING
Itt adhatod meg, milyen látogatói rétegnek szól a dokumentum. Pl: "ALL, CHILDREN, YOUNGS, SENIOR"
Az AUDIENCE metatag-al megegyező tartalmú.
Fontossága: kevésbé fontos
Itt valósítható meg automatikus továbbirányítás egy másik URL-re, pl. az oldal/webhely elköltözése esetén. Meghatározható, az oldal betöltése után hány másodperccel irányítson át a másik oldalra. Pl: " 5 " = 5 másodperc
Figyelem: A keresőrobotok nem követik ez a parancsot, vagy az ugyanilyen hatású javascriptes parancsokat. Ilyen átirányítással a következő oldalt kizárod a kereső indexeléséből.
Megjegyzés: ha nem kerülhető el a használata, érdemes az oldalon a következő oldalra mutató linket is elhelyezni, mivel a keresőrobotok a linkeket követik, valamint a böngészők sem mindig hajtják végre ezt a parancsot)
Fontossága: nem ajánlott!
<meta http-equiv="PRAGMA" content="NO-CACHE"> Ez a parancs a prody szervernek tiltja, hogy az oldalt tárolja. Minden alkalommal a tároló webszerverről fogja lekérni.
Fontossága: nem szükséges
Itt tilthatod le a kliens böngészőnek és a proxy szervernek, hogy az oldal tartalmát átmeneti memóriában tárolja. Az oldalt minden eléréskor a webről fogja lekérni. Hasznos gyakran frissülő oldaltartalmaknál, pl: webkamera.
Fontossága: nem szükséges
Ezzel a metatag-al meghatározhatod dokumentumod nyelvét. A keresők könnyebben megtalálják oldaladnak a megfelelő adatbázist, illetve nyelvre szűkített keresésnél nem fogják oldaladat téves találatként kilistázni.
Fontossága: kevésbé fontos
Ritkábban használt módja a cookie beállításának metatag-gal.
Fontossága: kevésbé fontos
Meta tagokkal létrehozhatók különféle effektek is. Ezek az effektek csak Internet Explorer böngészőkben futnak.
<meta http-equiv= "Page-Enter"content="blendTrans(Duration= 2.0)"> <meta http-equiv="Page-Exit"content="revealTrans(Duration=6.0,Transition=2)"> <meta http-equiv="Site-Enter"content="revealTrans(Duration=6.0,Transition=23)"> <meta http-equiv="Site-Exit"content="revealTrans(Duration=6.0,Transition=2)">
Ezekkel a meta tagokkal beállíthatók az effektek paraméterei is.
Fontossága: nem szükséges
A keresőrobotok a gyökérkönyvtárban mindig keresnek egy robots.txt nevű fájlt (http://www.mydomain.com/robots.txt). Ez a fájl megmondja a robotnak, melyik fájlt szabad letöltenie és melyiket zárta ki a webhely készítője a robotok indexeléséből (pl: jelszóval védett oldalak). Lehet minden keresőrobotra, vagy csak egyes keresőkre specializált utasításokat adni.
A fájl formátuma szigorúan meghatározott. A fájl rekordokból áll. Minden rekord két mezőt tartalmaz: egy USER-AGENT (kereső típusa) sort és egy, vagy több DISALLOW (letiltó) sort. A formátum a következő:
<Field> ":" <value>
A keresőrobotok az elért webhely gyökérkönyvtárában egy speciális fájlt, a "robots.txt" fájlt keresnek (http://www.mydomain.com/robots.txt). Ez a fájl mondja meg a robotnak, melyik oldalt szabad letöltenie. A rendszer neve Robot Exclusion Standard.
A robots.txt fájlnak speciális formátuma van. Rekordokból áll. Minden rekord két mezőt tartalmaz: egy User-agent sort és egy, vagy több Disallow sort. Körülbelül ilyen formában:
<Field> ":" <value>
A robots.txt fájl Unix line ender módban kell készíteni. Sok szövegszerkesztő tud ilyen módban dolgozni, esetleg az FTP kliens segítségével át lehet konvertálni. Ne használjunk olyan szövegszerkesztőt, amelyik nem alkalmas text-módban elkészíteni a robots.txt fájlt.
User-agent
Az User-agent sor határozza meg a robotot. Például:
User-agent: googlebot
Lehet joker karaktert (*) használni az összes robot kijelöléséhez.
User-agent: *
A fontosabb keresők robotjainak van itt használható rövidített nevük is.
Disallow:
A rekord második része tartalmazza a Disallow utasításokat. Ezek a sorok határozzák meg a tiltott fájlokat vagy könyvtárakat. A következő sor például megtiltja a robotnak az email.html fájl letöltését:
Disallow: email.htm
Letilthaszt egész könyvtárakat is:
Disallow: /cgi-bin/
Ezzel a sorral az egész cgi-bin könyvtáradat letiltottad.
Természetesen használható a joker karakter az összes könyvtár meghatározására.
Ha a disallow sor üresen marad, minden fájl engedélyezve van.
Ne felejtsük el, hogy minden user-agent sorhoz tartoznia kell disallow meghatározásnak is.
Üres betűhelyek és kommentek
A robots.txt fájlban minden sor, ami # karakterrel kezdődik, csak kommentet (megjegyzést) tartalmazhat. A specifikáció szerint a megjegyzés helyezhető a sor végére is, ez azonban a tapasztalat szerint hibás működést okozhat.
Disallow: bob #comment
Disallow: bob #comment