วันพฤหัสบดีที่ 20 มกราคม พ.ศ. 2554

search engine

เสิร์ชเอนจิน คืออะไร





            เสิร์ชเอนจิน (search engine) หรือ โปรแกรมค้นหา และคือ โปรแกรมที่ช่วยในการสืบค้นหาข้อมูล โดยเฉพาะข้อมูลบนอินเทอร์เน็ต โดยครอบคลุมทั้งข้อความ รูปภาพ ภาพเคลื่อนไหว เพลง ซอฟต์แวร์ แผนที่ ข้อมูลบุคคล กลุ่มข่าว และอื่น ๆ ซึ่งแตกต่างกันไปแล้วแต่โปรแกรมหรือผู้ให้บริการแต่ละราย. เสิร์ชเอนจินส่วนใหญ่จะค้นหาข้อมูลจากคำสำคัญ (คีย์เวิร์ด) ที่ผู้ใช้ป้อนเข้าไป จากนั้นก็จะแสดงรายการผลลัพธ์ที่มันคิดว่าผู้ใช้น่าจะต้องการขึ้นมา ในปัจจุบัน เสิร์ชเอนจินบางตัว เช่น กูเกิล จะบันทึกประวัติการค้นหาและการเลือกผลลัพธ์ของผู้ใช้ไว้ด้วย และจะนำประวัติที่บันทึกไว้นั้น มาช่วยกรองผลลัพธ์ในการค้นหาครั้งต่อ ๆ ไป


ประเภทของSearch Engine


        internet search enginesประเภทของ Search Engine และหลักการทำงาน internet search enginesเจ้าScarch Engine ที่ว่านี้ สามารถแบ่งออกได้หลากหลายประเภท โดยทั่วไปส่วนใหญ่แล้วจะอ้างอิงตามลักษณะการทำงาน ซึ่ง search engine submissionจะสามารถแบ่งประเภทได้ดังนี้ครับ

    1,แบบอาศัยการจัดเก็บข้อมูลเป็นหลัก Crawler-Based Search Engines
Crawler-Based Search Engines คือ เครื่องมือคำค้นหาบนอินเทอร์เน็ต
internet search engines แบบอาศัยการบันทึกและการจัดเก็บข้อมูลด้วยตัวเองเป็นหลัก นับได้ว่าเป็นประเภทของ Search Engine ที่ได้รับความนิยมในปัจจุบันมาที่สุด ด้วยประสิทธิถาพในส่วนของผลการค้นหาที่ให้ความแม่นยำสูงและการประมวลค้นหาภายในระยะเวลาอันรวดเร็ว ซึ่งถือได้ว่า Crawler-Based Search Engines ประเภทนี้ มีบทบาทสำคัญอย่างยิ่งต่อการก้าวกระโดดของวงการอินเทอร์เน็ตในโลกยุคปัจจุบันเลยก็ว่าได้ครับ
internet search enginesโดยหลัการทำงานจะอาศัยองค์ประกอบหลักอยู่ 2 ส่วนคือ
1. ฐานข้อมูลของตนเองที่มีระบบการประมวลผลและจัดอันดับการค้นหา internet search engines
2. คือระบบซอฟท์แวร์ ที่จะอาศัยโปรแกรมตัวเล็กๆ ว่า Web Crawler หรือ Spider หรือ
Search Enging Robots ครับ ส่วนภาษาไทยจะเรียกแบบง่ายๆว่า แมงมุม ครับ
เจ้าแมงมุมที่ว่านี้ จะคืบคลาน (Claw) ไปทุกเว็บไซต์ใน อินเทอร์เน็ตที่มันตรวจพบ โดยจะเน้นการมองหาเว็บไซต์ใหม่ๆเนื้อหาใหม่ๆ หรือแม้กระทั้งหน้าเพจเดิมที่มีการปรับปรุงเนื้อหาใหม่ (Update Content)
internet search engines


ซึ่งการเก็บข้อมูลนี้จะอาศัยหลักการ ไต่ ไปตามลิงค์ต่างๆ ของหน้าเพจที่กำลังทำการตรวจสอบอยู่ และจะทำการ สำเนาข้อมูล ของหน้าเพจนั้นๆทั้งหมด (มันก็คือการ Copy ข้อมูลทุกสิ่งทุกอย่างที่ตรวจพบ ยกเว้นไฟล์เอกสารที่อยู่ในตระกลู Flash เช่น .swf) แล้วจึงส่งข้อมูลที่ Copy แล้วกลับไปยัง Server ต้นทางของต้นเอง เพื่อทำการบันทึก(Pages Index) ลงสู่ฐานข้อมูลขนาดใหญ่ (Search Engine Index Server) ซึ่งเมื่อใดก็ตามที่เราทำการค้นหาสิ่งที่เรา
ต้องการนั้น Search Engine Server จะเริ่มทำการประมวลผลการฐานข้อมูลของตนเองที่ถือ
อยู่และแสดงผลการค้นหาออกมา
internet search engines

และนี่คือเหตุผลครับว่าทำไม Search Engine ชื่กดังหลายแห่งถึงได้ค้นหาหน้าเพจต่างๆได้
อย่างรวดเร็ว โดยใช้เวลาเพียงแค่เสี้ยววินาทีเท่านั้น
internet search enginesต่อการค้นหา 1 ครั้งโดยตัวอย่างของ Search Engine ประเภท นี้ก็คือ Google,Yahoo และ MSN นั้นเองครับ

    2. แบบสารบัญเว็บไซต์ Web Directory
Web Directory หรือ เว็บไดเร็คทนอรี่ หรือที่คนไทยนิยมเรียกติดปากว่า สารบัญเว็บไซต์
นั่นเอง เจ้ารูปแบบนี้จะอาศัยหลักการทำงานง่ายๆ เหมือนวิธีการใช้งานสมุดหน้าเหลือง ที่มีเนื้อหาที่ถูกแยกหมวด
internet search engines และจัดทำดัชนีไว้แล้วอย่างเป็นระเบียบไว้อย่างชัดเจน
ข้อดีก็คือเราจะสามารถเข้าไปดูข้อมูลของเว็บไซต์ทั้งหมด ที่มีเนื้อหาเกี่ยวข้องกัน และตรงตามที่เรากำลังต้องการของหมวดหมู่นั้นๆ ในปริมาณมาก และสามารถนำเอาข้อมูลเหล่านั้นมาลองดู ลองเอามาเปรียบเทียบกับเว็บไซต์อื่นๆ กันตรงนั้นได้เลย(เห็นหมดเลยว่าคู่แข่งเว็บเรามีใครบ้างก็เล่นมีเนื้อหาตรงกับเรานินา)
สำหรับการโปรโมทเว็บตนเองกันง่ายๆ แบบลูกทุ่งๆ ไม่ต้องอาศัยเทคนิคประเทืองปัญญากันเลยแม้แต่น้อย แค่เริ่มกันที่ขั้นตอนการลงทะเบียนเว็บไซต์ของเราลงสู่ระบบ
internet search engines ซึ่งเราต้องกรอกรายละเอียดที่จำเป็นเกี่ยวกับเว็บไซต์ของเรา ไม่ว่าจะเป็น ชื่อเว็บไซต์ URL ,รายละเอียดอย่างย่อ,หมวดหมู่ของเว็บไซต์ที่เหมาะสมกับเว็บไซต์เรา,คำค้นหาที่เราต้องการ
จากนั้นข้อมูลการลงทะเบียนเว็บไซต์ของเราจะถูกส่งไปยังเจ้าหน้าที่ผู้ดูแลของสารบัญเว็บไซต์นั้นๆ (โดยทัวยไปเรียกว่า Editor) ซึ่งหากเพื่อนๆกรอกรายละเอียดได้อย่างครบถ้วน และเลือกหมวดหมู่ที่ถูกต้องกับเนื้อหาเกี่ยวข้องเว็บไซต์ได้แล้ว ทางเจ้าหน้าที่ผู้ดูแลก็จะอนุมัติขอ้มูลในการลงสู่ฐานข้อมูลของสารบัญเว็บไซต์ให้ครับ
คราวนี้มาดูในส่วนของผู้ใช้งานสารบัญเว็บไซต์กันบ้าง ซึ่งธรรมชาติของ สารบัญเว็บไซต์ จะจัดแยกเว็บไซต์ต่างๆไว้อย่างเป็นหมวดหมู่ให้ถูกต้องมากที่สุด โดย
internet search enginesจะแยกหมวดไหญ่ออกมาก่อนจากนั้นจึงค่อยแตกย่อยเป็นหมวดเล็กๆ น้อยๆ ออกไปเรื่อย

    3.แบบอ้างอิงใน ชุดคำสั่งเมตะ Meta Search Engine
ก่อนจะรู้จักกับ Search Engine ประเภทนี้ ผมคงต้องขอแนะนำให้เรารู้จักกับอีกหนึ่งชุดคำสั่ง
ที่มักจะมีอยู่ใน Code HTML ตามหน้าเพจต่างๆ กันก่อนดีกว่าครับ ซึ่งก็คือชุดคำสั่ง Meta tag นั่นเอง
Meta Tag (เมตะ แท็ก) คือชุดคำสั่งที่ใช้สำหรับประกาศข้อมูลสำคัญต่างๆ ของเอกสาร หน้าเพจนั้นๆ เช่น ชื่อผู้พัฒนา เจ้าของเว็บไซต์ คำค้นหา (คีย์เวิร์ด) คำอธิบายย่อของเว็บไซต์โดยจะปรากฏในส่วนหัวของเอกสารเว็บ(Head Section) มีหน้าที่เพื่อแจ้งข้อมูลสำคัญๆให้กับ Search Engine Robots ได้รับทราบ
Search Engine ประเภทนี้ จะไม่มีระบบฐานข้อมูลของตนเองครับ แต่จะอาศัยข้อมูลจาก Search Engine Index Server จากที่อื่นหลายๆ ที่นำเอามาประมวลผลร่วมกัน ทำให้เกิดผลการค้นหาที่หลายหลาย แต่ในทางตรงกันข้าม ผลการค้นหาที่หลากหลายเหล่านั้นมักได้ผลลัพธ์ออกมาไม่เที่ยงตรงเท่าที่ควร เนื่องจากยังอาศัยข้อมูลจาก Search Engine Index Server หลายๆ แห่งนำมารวมกันครับ
ฉะนั้นชุดคำสั่ง Meta Tag จึงจำเป็นมากสำหรับเว็บไซต์ที่ต้องการทำ Ranking สูงๆ กับ
Meta Search Engine โดยเฉพาะครับ ตัวอย่าง เช่นที่ Ixquick



Search Engines ต่างประเทศ
1. Alexa
Top-500 Ranking of the most popular sites in the World !
www.alexa.com
3.All the webwww.alltheweb.com
5.Ananzi South Africa - Search Engines www.ananzi.co.za/
6.Ask Jeeveswww.askjeeves.com/
7.Chemical Search Enginewww.chemindustry.com
8.dmozdmoz.org/
12.Go.comwww.go.com

15.HealthAtoZ.comwww.healthatoz.com/
16.HighBeam eLibrary Researchwww.highbeam.com/library/index.asp?
18.Information Pleasewww.infoplease.com
19.Infoseekwww.infoseek.com
20.InfoMinewww.infomine.com
21.Librarians' Index to the Internetwww.lii.org
23.MAGELLANwww.mckinley.com
25.MSN Searchsearch.msn.com
26.NetGuidewww.netguide.com

27.Northern Lightwww.northernlight.com
28.Savvy Searchwww.savvy.com
30.Sciseekwww.sciseek.com
31.Search.Comwww.search.com
32.Search Engine Watchsearchenginewatch.com/awards/
33.Social Science Information Gateway
www.sosig.ac.uk
34.Twinginetwingine.com
36.WebCrawlerwebcrawler.com
37.Yahoo!www.yahoo.com



Search Engines ในประเทศไทย
ชมรมเว็บเพจไทยwww.webpagethai.org/
สรรสารwww.sansarn.com
สารบัญเว็บไทยwww.geocities.com/Tokyo/4737/
ThaiWebSearchwww.thaiseek.com
Intelliseekwww.intelliseek.com
Complete Planetwww.completeplanet.com
The Invisible Web directorywww.invisible-web.net

ความสำคัญของ search engine


            เสิร์ชเอนจินถือเป็นเครื่องมือใหม่ในการสืบค้นหาข้อมูลต่างๆบนโลกออนไลน์โดยเสิร์ชเอนจินทำงานอยู่บนเว็ปไซต์ค้นหาทั้งหลายเช่น Google,Yahoo,Msn เป็นต้นซึ่งในเว็ปไซต์เหล่านี้จะมีโปรแกรมค้นหาRobot ซึ่งข้อมูลที่ค้นหาต้องมีปรากฎอยู่ในฐานะข้อมูลของเว็ปไซต์ค้นหานั้นๆจึงจะหาพบซึ่งผู้ใช้อินเตอร์เน็ตจะทราบดีถึงวิธีการค้นหาข้อมูลต่างๆและผู้คนทั่วโลกก็นิยมค้นหาข้อมูลหรือเสิร์ชเอนจินผ่านเว็ปไซต์ค้นหามากขึ้นแบบก้าวกระโดดไม่ว่าจะหาอะไรก็หาเจอถ้าข้อมูลนั้นๆถูกนำมาจัดเก็บไว้ในฐานข้อมูลของเว็ปไซต์ค้นหา ดังนั้นเราจึงเห็นเว็ปไซต์แต่ละค่ายจึงต้องทำเสิร์ชเอนจินให้เว็ปไซต์ของตัวเองติดอันดับต้นๆในฐานะข้อมูลของเว็ปไซต์เสิร์ชเอนจินอย่างGoogleซึ่งถือว่าเป็นเว็ปไซต์ค้นหาอันดับหนึ่งของโลกที่มีผู้คนคนหามากที่สุดการค้นหาข้อมูลในเว็ปไซต์เสิร์ชเอนจินต้องใช้คีย์เวิร์ดซึ่งคีย์เวิร์ดที่ให้เป็นภาษาอะไรก็ได้ขึ้นอยู่กับแต่ละประเทศของเขตแดน
     ดังนั้นเสิร์ชเอนจินจึงมีความสำคัญมากๆสำหรับทุกๆเว็ปไซต์ที่ต้องการให้เว็ปไซต์ของตัวเองค้นหาได้ง่ายขึ้นเพื่อให้มีผู้เข้ามาเยี่ยมชมเพิ่มมากขึ้น โอกาสของธุรกิจก็จะมากขึ้นไปด้วยเสิร์ชเอนจินจึงมีความสำคัญและบทบาทเพิ่มมากขึ้นเรื่อยๆและรวดเร็วประเภทว่าเสิร์ชเอนจินโตแบบก้าวกระโดดก็ว่าได้


ประโยชน์ของเสิร์ชเอนจิน


1.ได้ลุกค้าและขายสินค้าได้อย่างต่อเนื่องตลอดเวลา
2.ไม่ต้องเสียค่าโฆษณาเป็นรายเดือนเหมือนสมัยก่อน
3.ลูกค้าเข้าขายได้ง่ายขึ้น ด้วยคีย์เวิร์ดต่างๆที่เราตั้งไว้
4.ปรับแต่ได้ง่ายและรวดเร็ว
5.เป็นบริการที่ฟรี



รายชื่อเสิร์ชเอนจินเรียงลำดับตามความนิยม


สัดส่วนของผู้ใช้ในสหรัฐอเมริกา
  1. กูเกิล (Google) 49.2%
  2. ยาฮู(Yahoo!) 23.8%
  3. เอ็มเอสเอ็น (MSN ) 9.6%
  4. เอโอแอล (AOL) 6.3%
  5. อาส์ก (Ask) 2.6%
  6. อื่นๆ 8.5%
เสิร์ชเอนจินอื่นๆ
  • ไป่ตู้ (Baidu) เสิร์ชเอนจิน อันดับ 1 ของประเทศจีน
  • Cuil
  • ยานเดกซ์ (Yandex) เสิร์ชเอนจิน อันดับ 1 ของรัสเซีย[3]

เสิร์ชเอนจินในอดีตที่ยกเลิกการใช้งานแล้ว

ในประเทศไทยมีการพัฒนาเครื่องมือค้นหาของไทยในชื่อ สรรสาร พัฒนาโดยเนคเทค


ประเภทของเครื่องมือค้นหา


           Catalog based search engine เป็นโปรแกรมสืบค้นข้อมูลในอินเทอร์เน็ตชนิดหนึ่ง โดยโปรแกรมจะรวบรวม และแยกจัดเก็บเว็บไว้ในฐานข้อมูลตามประเภทหัวข้อของเว็บ เมื่อผู้ใช้มาค้นหา ก็จะสามารถเข้าไปดูตามหัวข้อต่าง ๆ แล้วดูหัวข้อย่อย ๆ เข้าไปอีกจนกว่าจะเจอหัวข้อหรือเรื่องที่ต้องการ ตัวอย่าง catalog based search engine คือ Yahoo เป็นต้น ซึ่งจะต่างกับ query based search engine ที่จะต้องพิมพ์คำค้นหาเพื่อตรวจสอบกับฐานข้อมูลว่ามีข้อมูลนี้หรือไม่ ถ้ามีก็จะแสดงรายชื่อออกมา


หลักการทำงานของเสิร์ชเอนจิน


  • การตรวจค้นหาข้อมูลในเว็บเพจต่างๆ

  • ทำหน้าที่ในการรวบรวมข้อมูลที่ได้ทำการตรวจค้นไว้ในฐานข้อมูล

  • การแสดงผลการค้นหาข้อมูล

แหล่งข้อมูลอื่น


เสิร์ชเอนจินมาเก็ตติ้ง


อ้างอิง

  1. ^ ศัพท์บัญญัติคำว่า search engine คือ โปรแกรมค้นหา ชื่อในศัพท์บัญญัติ ข้อมูล ณ วันที่ 20 มิ.ย. 2551
  2. ^ สัดส่วนผู้ใช้งานเสิร์ชเอนจิน ข้อมูลจากเสิร์ชเอนจินวอตช์ ปี 2548
  3. ^ Where Google Isn't Goliath BusinessWeek

ไม่มีความคิดเห็น:

แสดงความคิดเห็น