1. 올해 7월 1일부로 구글 리더가 종료됨
  2. 현재 RSS 리더 다른 제품들은 거의 대부분이 직접 구독보다는 구글리더에 연동하도록 되어 있었음. 이 구조가 바뀌지 않으면 다른 리더 서비스도 무의미함
  3. 구글 리더로 생태를 다 말려 죽이더니 인제 와서 이러는건 문제가 있음
  4. 일단 OPML 파일을 급하게 내보냄. 리더 설정 -> 내보내기에 있음. 내보내보고 나서야 이게 XML과 JSON이라는걸 알았다는건 아이러니.
  5. HAN RSS로 일단 급하게 이사시킴. 구글 테이크에서 ZIP 압축 파일이 나올텐데 풀고서 XML 파일을 임포트 하면 됨. XML 파일은 하나고 JSON 파일은 여러개니까 눈에 딱 보일 거임.
  6. 일단 근데 한숨이 나옴.. HAN RSS는 솔직히 좀 별로 였는데.. 그냥 구글 리더 코드 다른 곳에 넘기면 안되나?



WRITTEN BY
가별이
내가 천사의 말 한다 해도

,
구글 광고를 달고 나서 저번달 수익이 10불가량 요번달 수익이 오늘까지 30불가량 발생했습니다. 저는 처음 달고 잘 몰랐는데 일정 수익이상이 발생하면 핀코드가 날아오고 핀코드가 날아오면 홈페이지에 입력을해야 진정하게 살아있는 계정으로 인증되어서 활성화되더군요.

뭐 그다지 낯설 것도 없는 것이 싸이트 가입 시 휴대폰을 통한 인증번호 입력하는 제도와 동일한데 이건 우편을 통해서 날아오고 실제 주소에 그 사람이 거주하는지 확인하는 제도더군요. 그 사람이 거기에 살아야만 하고 우편을 받을 수 있는지 확인하는 듯 하네요.

다만 PIN 코드가 발송된다고 알려준지 실제로 도착하는 데에는 꽤나 긴 시간이 걸립니다. 우편 내부에 적힌 글은 한글이지만 미국에서 국제 발송을 했기 때문이죠. 구글은 우편 발송 비용도 아마 적지 않게 들지 않을까 하는 생각이 듭니다.

대략 한달에 40불정도 (시작하고나서 이번 딱 한달 수익을 봐서는) 수익이 쌓이는 것 같습니다. 이대로라면 3개월만에 달성할지도 모르겠는데요? 여러분들이 광고를 다 클릭해주시는 덕분인 것 같습니다.

요새 좀 바쁘기는 하지만 성원에 힘입어서 더욱 포스팅에 노력해야겠습니다.

'일상사 > 블로그' 카테고리의 다른 글

블로그에 글을 쓰는게 어려운가?  (9) 2008.08.29
야후 블로그 순위  (4) 2008.08.27
단양 예천 여행기  (10) 2008.08.07
국순당 가브리엘  (18) 2008.08.07
RSS 리더기를 읽다보면 꼭 글이 남네  (4) 2008.08.07

WRITTEN BY
가별이
내가 천사의 말 한다 해도

,
블로그에 포스팅을 멈추면 유입자 수가 점차 줄어들게 됩니다. 주변으로부터 그런 얘기를 많이 들었고 저두 포스팅하는 숫자가 줄어들면서 그런 효과를 느끼고 있습니다.

왜 그런 효과가 벌어질까요? 한동안 의문을 가지고 있었지만 입증할 방법이 없어서 한참 고민하고 있었는데 얼마전에 그것에 대한 힌트를 잡았습니다.

일단 아래 링크를 한번 보시겠습니까? "페르소나"라는 게임 및 애니를 검색어로 하여 네이버에서 검색해본 결과입니다.

http://cafeblog.search.naver.com/search.naver?where=post&sm=tab_pge&query=%C6%E4%B8%A3%BC%D2%B3%AA&start=11&st=sim&date_option=-1&date_from=&date_to=&dup_remove=2&post_blogid=

처음에 검색되는 순위는 정확순과 최신순 중에서 정확순으로 검색이 됩니다. 하지만 이걸 주욱 내려보면 최신 글이 먼저 올라와있고 옛글이 뒤에 있습니다. 즉 키워드가 복합적으로 들어가서 유사하게 일치가 될 경우에는 우선적으로 최신 글이 노출된다는 얘기입니다. (물론 검색어 노출 정도와 유사 정도에 따라 날짜가 혼재되기는 합니다만 검색된 결과를 페이지 단위로 확확 넘겨보면 그런 성향이 보입니다.)

자신의 블로그가 검색엔진으로부터의 유입 비율이 어떻게 되느냐에 따라 다르겠지만 저처럼 검색 엔진으로부터의 유입이 70%에 가깝고 그 중 80% 가까운 네이버의 검색 결과 성향이 저렇다 보니 주기적으로 포스팅 하지 않는다면 옛글들은 묻혀서 검색으로부터 들어올 확률이 점차 낮아진다고 봅니다. 다움 또한 거의 그러할거라고 생각합니다. 구글은 검색 엔진 성향이 다르다는 것을 알고 있지만 유감스럽게도 구글로부터의 유입은 정말 적다보니 어쩔수가 없겠지요.

그렇다면 어떻게 하면 좋을까 생각해보았습니다.

1. 역시나 주기적으로 포스팅을 해서 새로운 검색 유입어를 만드는 것도 방법입니다. 검색 엔진의 비중이 적은 분이라면 더더욱 자주 포스팅 하지 않으면 확 줄어버리겠지요? 블로그 뉴스, 메타싸이트, 포털 메인 등은 계속해서 글이 갱신되니까요.

2. 옛글을을 계속 갱신해주는 방법이 있습니다. 좀 치사하고 귀찮기는 하지만 옛날 글부터 차례대로 계속 갱신해서 새로운 날짜로 바꿔준다면 검색 엔진이 새로운 날자로 판단하겠지요.. 하지만 귀찮아서 절대 하기 싫네요.

3. 영어로 포스팅하고 구글과 외국 검색엔진에 주로 노출시킨다면 저런 현상을 다소 줄일 수 있다는 생각이 듭니다.

4. 사람들이 찾을 듯한 제목을 써서 검색 엔진에 대해서 최대한 매치를 시켜주는 방법이 있습니다. 이왕이면 구체적으로 가격이라던지 재미라던지 문제점이라던지 이런 식으로 말이죠.


그냥 뭐 궁금해하고 있다가 갑자기 문득 생각이 나서 써보았답니다. 제 생각이 그럴듯 하나요?



WRITTEN BY
가별이
내가 천사의 말 한다 해도

,

구글 메일을 보다 보면  메일을 다 읽고 지우면 아래와 같은 메세지가 메일함에 뜹니다.


새 메일이 없습니다. 읽을 거리를 찾고 있다면 Google 뉴스를 확인해 보세요.


앞의 말은 당연한 말이지만 뒤에 써있는 저 말을 볼 때마다 감탄하게 됩니다. 정말 절묘한 아이디어란 말이죠. 바쁠 때야 누르지 않겠지만 보통 메일 보고 나면 바로 할일이 없잖아요? 정말 누르고 싶어지게 만든단 말이죠. 게다가 동기도 친절하게 부여해 줍니다. "읽을 거리를 찾고 있다면"이라고 말이죠.

"너 어차피 언터넷 창 열어서 메일도 확인했겠다 이제 뭐 할까 고민하는 딱 그 타이밍이지? 자 망설이지 말고 나를 누르고 오늘 주요뉴스만 가볍게 함 훓어보도록 해. 다 읽으란 것도 아니고 주요 뉴스만 봐도 되니까 말야. 부담없이 누르라구."

딱 이렇게 말하는 것 같아요. 게다가 드는 느낌은 틀림없이 저 아이디어는 개발자가 냈을거라는 생각이 듭니다. 말투가 딱 그런 느낌이거든요. 우리나라의 개발자라던가 개발환경에서는 저렇게 유연하게 저 말을 저 위치에 삽입할 수가 없었을 것 같네요.. 전에 듣기로는 뉴스 클릭당 돈이 발생한다는 것 같았는데.. 말 하나 적재적소에 삽입해서 수익을 올리는 정말 절묘하다는.. 생각을 늘 하곤 합니다.


WRITTEN BY
가별이
내가 천사의 말 한다 해도

,

링크는

http://www.google.co.kr/landing/saturi/

예운이 아주 웃겨 죽네요.

Google 사투리 로고

Google 사투리 번역을 소개합니다

개요

'Google 사투리 번역'이란 무엇인가요?

Google 사투리 번역은 사람이 직접 번역하는 대신 고도의 기계번역 기술을 활용해 제공되는 서비스입니다. Google KoreaR&D 센터는 여러 사투리 조합에 대한 통계 번역 시스템을 자체 개발했으며 현재 Google 번역을 통해 서비스 되고 있습니다. 예를 들어 번역하고자 하는 문장을 전라도 사투리로 넣으면, 해당 문장을 다양한 사투리로 번역하여 문서를 검색하고, 검색된 문서들은 다시 전라도 사투리로 변환되어 사용자에게 제공됩니다. Google 사투리 번역을 이용하면 다른 지역의 사투리를 모르더라도 불편 없이 모든 문서를 검색할 수 있습니다.

사투리 번역을 활용하고 있는 Google의 다른 서비스는 어떤 것들이 있나요?

Google 번역 아이콘

Google 번역에서 사투리 직접 번역이 가능합니다. 글상자 안에 문장을 입력한 후 원하시는 사투리 조합을 택하고 "번역하기" 버튼을 누르시면 우측에 해당 사투리로의 번역 결과가 나타납니다.

예시1: Google 사투리 번역 기술은 경상도 사투리에서 많이 나타나는 압축된 단어나 문장도 인지하여 번역해줍니다.

Screenshot

예시2: 전라도 사투리에서 많이 나타나는 단어의 모호성을 문맥에 맞춰 해석한 후 번역하여 보여줍니다.

Screenshot
Google 토크 아이콘

Google 토크에서도 사투리 번역 기능을 사용할 수 있습니다. Google 토크 계정 생성시 이용자가 구사하는 사투리의 지역 정보를 입력하면 됩니다. 제주도 사투리를 사용하는 친구와 채팅할 때에는 제주도 사투리를 자동 검출해서 이용자의 사투리로 자동 번역해주기 때문에 의사소통이 훨씬 원활해집니다.

Google 토크에서의 Google 사투리 번역 사용 예
Gmail 아이콘

Gmail에서도 사투리 번역 기능을 사용할 수 있습니다. 사투리로 작성된 메일을 받은 경우 "사투리 번역" 버튼을 누르면 메일의 내용이 자동으로 이용자의 지역 사투리로 변환됩니다. Google은 보다 나은 사투리 번역을 제공하기 위해 계속 노력하고 있습니다. 그러나 아무리 정교한 소프트웨어라도 원어민의 유창함을 따라갈 수는 없습니다. 사투리 번역 기능이 아직 완벽하지 않아 가끔 이해하기 어려운 경우가 발생할 수 있는데, 이 때는 해당 문장을 선택하면 원문을 보실 수 있습니다.

Gmail에서의 구글 사투리 사용 예





하지만.. 직접 사용해보려구 눌러보니!!

Google 사투리 로고

Google 사투리 번역 정보

Google의 만우절 페이지에 오신 것을 환영합니다!

이 미 추측하셨겠지만 Google 사투리 번역은 실제 구현되는 기능이 아닙니다. 물론 이런 번역 기능이 있다면 정말 좋겠지만 아쉽게도 아직까지는 개발되지 않았습니다. 그러나 Google은 전세계 모든 사용자들이 언어장벽 없이 지식을 공유할 수 있도록 계속해서 다양한 기술을 개발하고 있습니다. Google Korea 역시 대한민국 오천만이 자유롭게 검색하고 대화하는 그날까지 계속 노력하겠습니다. 즐거운 만우절을 맞이하여, 아래 Google의 제품들도 즐겁게 사용하시길 바랍니다.




ㅋㅋㅋ 그럼 그렇지.. 구글도 센스 있는 걸요?

개발자 질의 응답 내용도 만만치 않네요. 한 번 살펴보세요.

개발자 질의응답

작성자: 이충식 (구글 코리아 소프트웨어 엔지니어)
날짜: 2008년 4월 1일

개발자 사진

핵심기술에 대해 간단히 설명해 주시겠습니까?

기 계번역에 관한 연구는 컴퓨터 개발 초창기부터 진행이 되어 왔습니다. 많은 시도가 있었지만 너무 많은 계산량이 필요했기 때문에 당시 기술로는 실제 시스템으로 구현하는데 어려움이 많았습니다. 그러나 구글의 거대한 네트웍 컴퓨팅 파워를 이용할 수 있게 되면서 희망이 생기기 시작했지요. 수없이 많은 컴퓨터를 서로 네트웍으로 연결하여 하나의 가상 컴퓨터처럼 사용할 수 있게 되면서 예전에는 상상할 수 없는 수준의 계산을 처리할 수 있게 되었습니다.

구글의 번역 기술은 이러한 강력한 하드웨어 및 네트워킹 기술을 기반으로 그 위에 통계 기반 인공지능 기술을 접목해서 구현이 되고 있습니다. 수십억 단어 수준의 상호 번역 데이터로부터 다양한 기법을 사용하여 문장, 구문, 단어간 번역 후보를 생성합니다. 사용하는 상호 번역 데이터가 많으면 많을수록, 그 품질이 좋으면 좋을수록 더욱 좋은 품질의 번역 후보들이 생성됩니다. 이렇게 생성된 번역 후보들을 결합하여 최종적으로 사용자가 입력한 문장을 가장 자연스러운 형태로 생성합니다. 이번에 개발한 사투리 번역 기술도 동일한 기술을 사용하고 있습니다.

사투리 번역 구현시 기술적으로 가장 어려웠던 점은 무엇입니까?

데 이터를 모으는 작업이 가장 어려웠습니다. 두 언어 간의 번역기를 만들기 위해서는 방대한 양의 병렬 데이터 - 두 사투리 간의 번역 데이터 - 가 필요하기 때문에 사투리 번역 서비스를 개발하기로 결정한 후, 곧바로 대규모 병렬 데이터 수집에 착수했습니다. 현존하는 사투리 병렬 데이터가 많지 않을 것으로 보고 직접 인력을 투입하여 데이터를 생성하기로 결정했습니다. 각 지역별로 사투리에 능숙한 인력을 고용하여 수개월간의 작업 끝에 20억 단어 규모의 표준어, 전라도, 경상도, 충청도, 제주도, 강원도 사투리 데이터베이스를 구축했습니다.

형태소 분석 작업 역시 어려웠습니다. 오랜 세월을 거쳐서 변형을 거듭해 온 사투리는 표준어에 비하여 규칙을 따르지 않는 경우가 많았고, 다양한 형태소가 축약되어 말하기 편한 형태로 변화하는 경우가 많기 때문에 기존의 한국어 형태소 분석기로는 사투리 문장들을 정확하게 분석할 수 없는 어려움이 있었습니다. 그러나 수많은 시행착오 끝에 자동 규칙 생성기를 만들어 데이터로부터 규칙을 생성할 수 있게 되어, 이제는 어떤 사투리라도 데이터만 주어진다면 자동으로 해당 사투리에 대한 형태소 분석기를 만들 수 있게 되었습니다.

또한 사투리 지역 검출이 쉽지 않은 문제가 있었습니다. 번역할 임의의 문장이 주어졌을 때, 해당 문장이 어느 지역 사투리인지 자동으로 검출하는 기술이 필요한데 서로 다른 인코딩을 사용하는 언어였다면 인코딩 방식의 통계를 기초로 언어를 판별할 수 있는데 반하여, 사투리 번역에 있어서는 동일한 인코딩을 사용하기 때문에 좀 더 고차원의 특징을 관찰해야 하는 어려움이 있었습니다.

이 외에도 사투리 문장에서는 표준어보다 단어의 모호성이 심한 문제가 있었습니다. 단적인 예로 전라도와 충청도에서 자주 발생하는 사투리 단어인 "거시기"가 있습니다. 이러한 단어에 대한 모호성 해소를 위해 문맥 전체를 파악하는 기술 역시 쉽지 않았습니다.

번역 품질을 높이기 위해 계획하고 있는 기술은 무엇입니까?

앞 서 말씀드렸듯이, 데이터를 쉽게 구할 수 없는 지역의 사투리 번역기를 만드는 일입니다. 소수 만이 사용하고 있는 사투리는 현실적으로 많은 데이터를 구할 수 없는 문제가 있습니다. 이를 해결하기 위해서 타 사투리를 통해서 번역하는 간접 번역 기술을 구현할 생각입니다. 예를 들어, 연변 사투리를 제주 사투리로 번역하려 하는 경우, 연변과 제주도는 지역적으로 멀리 떨어져 있어서 상호 번역물이 많이 존재하지 않습니다. 이런 경우 데이터가 많은 연변-서울, 서울-제주 사투리 데이터를 이용하여 간접 번역기를 구현할 수 있을 것으로 예상됩니다.

사투리 번역 기술의 미래를 어떻게 보십니까?

Google은 세상 모든 사람들이 언어장벽 없이 의사소통 하는 세계를 만들기 위해 계속 노력하고 있습니다. 이러한 꿈을 실현시키기 위해서 앞으로 얼마나 더 많은 시간과 노력이 필요할 지는 모르겠지만, 단기적으로는 사투리 번역기와 음성 인식을 결합하는 연구를 계속하여 궁극적으로 사투리 통역기를 만들 구상을 하고 있습니다.



WRITTEN BY
가별이
내가 천사의 말 한다 해도

,