http://kldp.org/blog/14609
- Google system , lucene, Hadoop루씬(lucene) - http://lucene.apache.org/
http://blueiblog.com/ko/24
몇가지 웹서비스를 구상하고 있는데, 검색엔진에 손을 대야 하나 고민중이다.
자료를 수집하고 있는데, 흥미롭다. 그러나 방대하다. 그래서 고민이다.
시작해야 하나?
손댈만한 가치는 있어 보인다. ^^
'검색엔진'에 해당되는 글 6건
http://kldp.org/blog/14609 - Google system , lucene, Hadoop루씬(lucene) - http://lucene.apache.org/ http://blueiblog.com/ko/24 몇가지 웹서비스를 구상하고 있는데, 검색엔진에 손을 대야 하나 고민중이다. 자료를 수집하고 있는데, 흥미롭다. 그러나 방대하다. 그래서 고민이다. 시작해야 하나? 손댈만한 가치는 있어 보인다. ^^
TAG 검색엔진
받은 트랙백이 없고
,
댓글이 없습니다.
,
그 경계, 허용범위 에 대하여.. 블로그의 글을 올린다. 그글은 메타사이트를 통해, RSS 리더를 통해, 혹은 검색엔진에 노출되어 제3자에게 보여진다. 1. 메타사이트 - 블로거가 직접등록하기 때문에 제3자의 열람을 허락한다. 2. RSS 리더 - 블로그에 방문하는 것처럼 RSS 피드를 제공하기 때문에 리더를 통해 리더를 사용하는 사람에게 열람을 허락한다. 3. 검색엔진 - robots.txt 를 통해 막지 않는다면, 검색엔진이 가져가서 검색을 통한 열람을 허락한다. 4. 개인화서비스 - 여기서도 RSS 리더와 비슷하게 운영할 수 있다. 개인설정/로그인 후 개인만 본다 - RSS 리더와 비슷 5. 플래닛 - 공통주제, 관련블로거 들의 피드를 모아서 일종의 미니메타사이트형태로 제공한다. 블로거들에게 허락(?)을 받았을까? 여기에서는 '같기道' 와 같은 애매한 경우가 있다. 이건 RSS 리더도 아니고 메타사이트도 아녀! 이건 메타사이트도 아니고 검색엔진도 아녀! 그 예가 될지는 모르겠지만, HanRSS 와 트렌비 (trenb) 를 보면.HanRSS 는 각 개인이 자신만의 Feed 를 등록하고, 리더를 통해 글을 본다. 트렌비는 검색엔진인지, HanRSS 를 통해 수집한 데이터를 보여주기만 하는 것인지 정확히 모르겠지만, 후자라면 문제의 소지가 있다. HanRSS 리더를 통한 개인적(?)수집이 트렌비 를 통해 제3자에게 노출되는 것이다. 트렌비가 검색로봇을 돌려 수집한 데이터들이라면 상관없는 문제다. 지금 하는 이야기는 옳고 그름을 따지자는 것이 아니라, 각 서비스간의 경계(허용범위)가 명확하지 않다는 것이다.(나에게만 모호함이 느껴지나?) 이올린, 올블 같은 메타사이트들은 블로거들의 가입과 공개여부를 허락받기 때문에 이런 문제가 발생하지 않는다. 그런데, 이때 RSS 리더 - 플래닛 - 메타사이트 간의 경계가 모호하다. 플래닛은 개인이 자신의 관심블로그의 피드를 묶어서 자신만의 메타 사이트를 만들 수 있다. RSS 리더와도 비슷하고, 메타사이트와도 비슷하다. 이 플래닛이 제3자에게 서비스가 된다면 문제가 있겠다. 블로거들 지인들끼리 서로의 동의하에 플래닛을 만든다면 이것은 별 상관이 없겠다. 다음 DNA lens 는 언뜻 플래닛처럼 보이지만, 피드의 본문을 보여주지 않고 제목만 보여주기 때문에 링크를 통해 해당 블로그를 방문해서 봐야 한다. 아니 그렇다면 올블같은 메타사이트도 피드요약은 보여주지만, 본문전체를 보여주지 않고 방문해서 봐야 한다. 다만 추천툴바(?), iframe 으로 가둬놓는 것이 다를뿐, 툴바를 걷어내면 똑같다고 봐야 하는 것 아닌가? 글을 쓰면서 조금은 정리가 된다. 블로그에 글을 올리고, RSS 피드를 제공한다는 행위는 자신의 블로그에 직,간접적으로 접속하여 열람하는 사람들에게 허용한다는 것이다. 그런데, 그것이 직,간접적인 접속없이 제 3자에게 보여진다는 것은 불가를 의미한다. 그 행위는 일종의 펌질에 해당한다. 이 문제의 핵심에는 RSS 피드(Feed) 가 존재한다. 넌 앞으로 어떻게 될 것인가? ps. 예전에 적었던 글이고, 덜 정리된 느낌인데, 그냥 포스팅합니다. 추후 다시 정리해봐야 겠음. 이라는 말이 나온다.관련글 http://toheart.pe.kr/tt/350 의 아래부분을 보면대충 이런 내용의 글을 쓰면서 틈틈히 시간나는대로검색결과 노출에 대한 규칙은 검색엔진마다 다를 것이다. 또한 메인에 노출되는 결과에 대한 규칙도 다를 것 같다. 사실 이런 논의는 네이버가 검색결과에 대한 알고리즘(규칙)을 공개하지 않는 이상. 별 의미가 없어 보인다. 그런데, 펌글에 대한 조치를 네이버가 어떻게 할지 모르겠다. 검색결과로는 누가 원글이고 펌글인지 알 수 없다. - 원글 저작권자는 속 터질 노릇이다.
받은 트랙백이 없고
,
댓글이 없습니다.
,
블로그 검색사이트를 알아본다. 각종 포털(다음,네이버,야후...) 의 블로그 검색은 생략 보통 검색들과 큰 차이가 없다고 본다.(물론 그 영향력을 간과하는 것은 아님) 1. 메타사이트들의 블로그검색 a. 올블로그 검색 ![]() 메타블로그의 특성상 - 블로그 검색의 강점이 있다.(블로그를 엄선?) 그러나 올블로그 검색은 Alpha 라 그런지 특히 검색속도의 문제를 안고 있다. 올블로서는 꼭 풀어야할 숙제. 내부시스템을 Lucene 을 쓰고 있는 것으로 알고 있는데, 최적화/개선이 필요할 듯 하다. b. 이올린/티스토리 개인적인 판단으로 검색결과는 올블로그에 비해 못 미친다. 2. 블로그 검색전문 a. BlogReader : http://www.blogreader.co.kr ![]() 공식 블로그 - http://blogreader.tistory.com/ ![]() b. 트렌비 - http://www.trenb.com ![]() ![]() 속도, 결과 만족. 블로그 검색 전용은 아니지만, HanRSS 개발자 분이 만드셔서 그런지 블로그 검색이 많다. 그리고, 오픈마루 와 관련있는듯.(스폰서?)3. 검색사이트 에서 블로그 검색 - 구글 블로그 검색 : http://www.google.co.kr/blogsearch
다른 블로그 검색과 다른 특이한 점은 게시(등록)된 시간별 최근 1시간, 1주, 1달 등으로 (기간도 가능) 구분해서 볼 수 있다는 것 이제 본격적으로 블로그검색 전문 서비스가 계속 나올 듯 싶다. 어쩌면 블로그검색 도 더 세분화되서 나올것이라고 살짝 예상해본다. 블로그 검색전문 서비스들이 많이 나오고 활용이 많아지면, 블로그 메타 서비스의 위치가 애매해지거나 위태롭게 되지 않을까 한다.
트랙백은 하나
,
댓글 5개가 달렸습니다.
,
그러나, 하루에 올라오는 글이 많아지니, 내 글이 노출되는 비율이 현저히 떨어졌다. (나의 관점은 이미 메타사이트에서 실시간글의 기능은 무용지물이 되었다.) 블로그에 글을 쓰는 입장에서는 자신의 글이 많이 노출되길 바란다. 그 바램이 나타난 것일 뿐이다. 그 심리가 작용된 것이다. 자추가 없어진다면 또 다른 방법이 나타나겠지. 여기에 마케팅 이라는 단어를 가져다 붙일 필요도 없이 당연한 결과라고 생각한다. (왠 뜬금없이 마케팅? -- 넘어가고..) 그런데, 블로거들은 잠시 생각해 볼 것이 있다. 이런 방법(자추등..)이 언제까지 가능할까? 지금은 자추하는 사람들이 적기 때문에 효과적이다. 그런데, 그 수가 더 많아진다면? 결국에는 쓸모없게 된다. 그 중에서도 인기글(좋은글)이 가려지게 된다. 나중에는 자추하나 안하나 같아진다는 것이다.(지금은 효과적이긴 하다) 시간문제인것이다. 아무튼 결국에는 좋은글, 인기글이 내블로그의 트래픽을 좌우하게 된다.(낚시는 제외) 자추에 신경쓰느니, 좋은글을 쓰는데 신경을 쓰는 것이 낫다. 차라리 SEO(검색엔진최적화)쪽에 관심을 가지는 것이 더 좋을 것이다.(물론 이 방법이 최선은 아니다)글이 많아지면, 사람들은 검색엔진을 쓸 수 밖에 없다. 그 검색엔진에 많이 노출되고 상위에 노출될 수 있도록 하는 것이 나중을 위해서도 현명한 방법이다. 아! 전제조건을 좋은 글을 쓰는 것이다. 이것은 잊지 말아야 한다.
트랙백 3개
,
댓글 2개가 달렸습니다.
,
![]() -> 링크이동 : http://itsdons.com/tag/SEO ![]() 검색엔진최적화 - 해당 글은 구글에 대한 이야기를 하고 있다. 국내에서는 네이버가 대부분의 점유율을 가져가고 있기 때문에 조정할 부분이 있을 듯 하다. 큰 제목만 언급하자면.. 1. 키워드가 풍부한 컨텐츠 2. 주제가 있는 사이트 3. 사이트 디자인 4. 내부 링크걸기 5. 정규적으로 업데이트 시켜라 6. Outbound links 7. 당신의 도메인 이름을 현명하게 골라라 8. 당신의 도메인을 길게 등록해라 9. 한 포스트당 한 주제만 써라 10. 최적화된 길이의 포스트를 써라 이렇게 언급하고 있다. 어떻게 보면 일반적인 내용인 것 같다. 네이버의 경우에는 어떻게 달라질까? |
댓글을 달아 주세요