실생활에서 어떤 것에 대한 궁금증으로 관련 정보를 얻으려고 할 때 가장 먼저 취하는 행동이 인터넷 검색이고 여기서 가장 적합한 정보를 효율적으로 빨리 취하는 것도 그만큼 중요할 것이다. 대부분 직접적이고 효율적인 관련 검색어의 선택만으로도 원하는 정보를 얻을 수 있지만, 좀 더 정교하게 추려낸 검색 결과를 원한다면 특별한 요령이 필요하다.

그래서 대표적으로 Google에서는 효율적인 정보 검색을 도와주는 몇 가지 요령을 담은 문서를 제공하고 있다.

다음은 개인적으로 몇 가지 몰랐던 내용:
검색 결과에서 특정 단어의 배제 (-) – 특정 검색어 앞에 마이너스 사인을 붙이면 해당 단어가 포함된 페이지는 솎아내고 나머지의 검색 결과를 보여준다. 마이너스 사인 바로 앞에 다른 글자가 붙어 있으면 안 되고 검색어 사이엔 공백으로 띄워져 있어야만 제대로 인식된다.
동의어 검색 (~) – 검색어와 더불어 해당 동의어도 함께 포함된 검색 결과를 얻으려면 검색어 앞에 물결무늬 사인(~)을 붙여주면 된다.

이 밖에도 Google 검색 요령에 관한 더 자세한 내용을 담은 cheat sheets:

이렇게 요긴한 검색 요령만 잘 알고 있으면 다음과 같은 족집게 검색도 가능하다.

site:nytimes.com filetype:html ~college intitle:"test scores" intext:"new york city" -SATs 2010..2011

456 Berea Street에 올라온 글을 보면, 저자인 Roger씨가 웹 표준(HTML 4.01 Strict)에 맞게 다시 설계한 Google의 대문 페이지를 공개하였다. 결과적으로 페이지는 웹 표준을 준수하면서도 그 크기 또한 원래보다 1,042 bytes 만큼 줄일 수 있었다고 한다.

이로써, Google은 인터넷 접속 대역폭을 절약하기 위해 어쩔 수 없이 표준에 맞지 않는 HTML 코드를 사용해야만 했다는 속설은 사실이 아니라는 판명이다.

그렇다면, 왜 기술을 선도하면서 앞선 기술을 잘 활용하고 있다는 Google이 웹 표준 준수에 따른 여러가지 이점들을 제처두고, 여전히 표준에도 맞지 않는 코드를 고집하고 있는 이유는 무것일까? 과거 웹 브라우져들과의 호환성을 위해서인지, 아니면 단순한 개발자의 무시 혹은 서버 환경의 경직성이든지 간에 우리는 그저 추측만 할 수 있을 뿐이다.

웹 접근성과 웹 표준의 준수는 같은 목표를 공유하고 있다는 것을 누구나 알고 있을진데, 과연 그 둘을 동시에 만족시키기란 기술적으로 그렇게 어려운 것일까?

관련 글: Google Strict vs Google Deprecated

추가 갱신: Google Goes To Web Standardsville, Part Two

Google 검색창에서 다음과 같이 입력해 보았다.

cache:http://appletree.mine.nu:8080
site:appletree.mine.nu
link:appletree.mine.nu

그런데 아무런 결과도 없단다.
그렇다면, 수도 없이 들락거리던 Googlebot들은 가구조사 안 하고 무엇을 엿보고 있었단 말인가?

어쩌면, 그 이유는 셋 중의 하나일 것이다.

  1. Google의 색인 캐쉬(indexed cashe)가 아직 갱신되지 않았거나, 혹은 아예 데이터베이스에 색인도 되어 있지 않았을 것이다. (설마?)
  2. 어쩌면 서버의 도메인(domain) 이름이 제대로 된 것이 아니어서, 혹은 살짝 벗어나 열려 있는 port 번호 때문? (글쎄…)
  3. 이것도 저것도 아니라면, 집 안을 차지하고 있는 별 볼 일 없는 가구 살림들과 집주인 때문일지도 모르겠다. (하지만, bot은 bot일 뿐.)

그래! 이 세상, 표면 아래에 숨어 있는 곳이 어디 이곳 뿐이랴… 🙄
(어찌 된 일인지, 한국 Yahoo의 가구조사 기록에는 분명한 자국이 남아 있군.)