Rev. 2.73

트위터가 가진 데이터는 왜이리 가지고 싶은걸까요? 요 며칠동안 트위터에 저장된 데이터를 가져오기 위해 그들이 제공하는 오픈 API로 많은 삽질을 해 보았지만 이렇다 할 성과를 거두지 못했습니다. 얻은 결론은 오픈 API를 통해서는 트위터 사이트로 부터 얻어낼 수 있는 만큼의 데이터를 확보하기는 어렵다는 것입니다. 그래서 다음과 같은 북마크릿을 만들었습니다. 이 북마크릿은 트위터에서 현재 머무르고 있는 곳의 모든 자료를 JSON 스트링으로 만들어 줍니다. 예를들어 @사용자ID 를 클릭하여 멘션을 조회하는 상태라면 트위터 서비스에서 허용한 데이터 출력 범위 내의 모든 멘션 데이터를 JSON으로 만들어 주는 것입니다.

HTML로 부터 얻어내는 데이터는 다음과 같습니다.

{
  "user": {
    "screen_name": "zziuni",
    "profile_image_url": "http://a0.twimg.com/profile_images/1082290724/gravatar_normal.jpg"
  },
  "id": "19455882373",
  "text": "@firejune 큰일날뻔했군요.. waterjune.com 될뻔.. ㅡ ㅡ;",
  "source": "<a href=\"http://www.tweetdeck.com\" rel=\"nofollow\">TweetDeck</a>",
  "created_at": "Sun Jul 25 00:12:55 +0000 2010",
  "in_reply_to_status_id": "19431051539"
}

일단 이곳에서 필요로하는 최소한의 데이터 속성들만 수집하였으며 필요하면 더 많은 속성을 추출할 수도 있을 것입니다. 그리고 유기적으로 연결된 글들을 표현하기 위한 데이터이므로 "in_reply_to_status_id" 값이 없는 것들은 제외하였습니다. 아래의 북마크릿을 브라우저의 북마크 바에 끌어다 놓고 트위터 페이지에서 추가된 북마크릿을 클릭하여 사용할 수 있습니다. 수집이 완료되는 즉시 결과을 페이지에 출력하며 AJAX 요청이 많이 일어나기 때문에 환경에 따라서는 수분이 소요될 수도 있습니다. 트위터가 사용하는 스크립트를 이용하기 때문에 나중에는 작동하지 않을 수도 있으니 필요한 분들은 지금 덤프하세요.

twtdump 북마크릿 - 이 링크를 브라우저의 북마크 바로 끌어다 놓으세요.
twtdump.js 스크립트 소스 - 직접 수정해서 사용하세요.

Comments

Got something to add? You can just leave a comment.

Your Reaction Time!

captcha

avatar