3월20일

2.
'Towards Data Science'의 데이터 사이언티스트 [Tom Sharp가 쓴 글]('Towards Data Science'의 데이터 사이언티스트 Tom Sharp가 쓴 글입니다. 약간 재미있습니다.

코로나19를 다룬 뉴욕타임스와 CNN의 기사 5000여건을 긁어와서 분석을 했는데요. 결론은

2월23일을 기점으로 기사의 톤(주관성과 극성)이 널뛰기 시작한다는 겁니다. 중간값은 일정하게 유지가 되긴 하는데, 표준편차가 커졌다는 겁니다. 특히 뉴욕타임스가 CNN보다 더 주관성이나 극성의 표준편차가 시간이 지날수록 더 커졌다고 합니다.

상황이 심각해지면서, 뉴욕타임스 편집국 안에서 조금 흥분된 기사도 허용되고 있다는 의미가 아닐까 합니다. 그래도 중간값이 일정하게 유지되는 거 보면 편집국 차원에서 톤 관리는 잘 이뤄지는 것 같긴 합니다. CNN은 상대적으로 드라이하게 움직이는 듯 보이고요.

감성 분석에 사용된 툴은 : Textblob이라는 파이썬 라이브러리. (https://textblob.readthedocs.io/en/dev/quickstart.html))입니다. 약간 재미있습니다.

코로나19를 다룬 뉴욕타임스와 CNN의 기사 5000여건을 긁어와서 분석을 했는데요. 결론은

2월23일을 기점으로 기사의 톤(주관성과 극성)이 널뛰기 시작한다는 겁니다. 중간값은 일정하게 유지가 되긴 하는데, 표준편차가 커졌다는 겁니다. 특히 뉴욕타임스가 CNN보다 더 주관성이나 극성의 표준편차가 시간이 지날수록 더 커졌다고 합니다.

상황이 심각해지면서, 뉴욕타임스 편집국 안에서 조금 흥분된 기사도 허용되고 있다는 의미가 아닐까 합니다. 그래도 중간값이 일정하게 유지되는 거 보면 편집국 차원에서 톤 관리는 잘 이뤄지는 것 같긴 합니다. CNN은 상대적으로 드라이하게 움직이는 듯 보이고요.

감성 분석에 사용된 툴은 : Textblob이라는 파이썬 라이브러리. (https://textblob.readthedocs.io/en/dev/quickstart.html)

1.
한때 저도 AR 저널리즘에 열광했던 적이 있었습니다. 기술 자체에 과도하게 매몰되면 그것이 마치 미래인양 착각하게 되죠. 제가 그랬던 기억입니다. 물론 다시 기회를 얻어 부활할 가능성도 충분히 있습니다. 그러나 지금은 아닌 모양입니다. 매직리프까지 흔들리는 와중이라니.

3월19일

5.
크로스체크로 유명했던, 비영리 사실검증 기구인 퍼스트드래프트가 '저널리스트를 위한 검증 교육'을 온라인으로 내놨습니다. 처음엔 그냥 자동번역으로 했겠거니 했는데 아니더군요. 약간 신경 써서 번역을 해뒀더고요. 팩트체크에 도움이 될 만한 다양한 사례와 도구를 소개하고 있습니다. 아마 시간 내서 볼 여력이 없는 분들이 많긴 하겠지만, 그래도 한번 찜은 해두면 좋지 않을까 해서 공유드립니다.

4.
예전에 그런 얘기를 꺼냈던 적이 있습니다. 네이버 등에서 수용하지 않는 혹은 잘 노출되지 않는 깊고 품질 높은 뉴스만을 애그리게이팅 하는 사이트를 만들어보면 어떨까요?라고 말이죠. 물론 이걸로 BM을 만드는 건 단기간에 쉽지는 않을 겁니다.

약간 비슷한 게 아래 사이트가 아닌가 합니다. 머독 집안의 작품입니다. 론칭한 지 이제 2달 정도 돼 가는 것 같네요. 그렇게 허접하진 않습니다. 시작부터 "우린 필터버블 없다, 허위정보 없다" 이렇게 선언하고 시작을 했는데요. 그럭저럭.

그렇다고 머독이 소유한 언론사의 뉴스만 긁어오진 않습니다. 400개 이상의 언론사 뉴스를 수집해온다고 합니다. 완전 아웃링크 방식이고 배열은 알고리즘이 거의 맡습니다. 국내에서 참 많이 논의됐던 그림이긴 하죠.

한번 슬쩍 훑어보고 의견 좀 주시겠어요? 어떤 느낌인지?

3.
이 프로젝트는 네이버 클로바 더빙과 같이 해봐도 나쁘지 않을 것 같은데. SKT를 택했군요. 클로바 더빙 쪽이 음성 합성 API를 (길게) 열어주면, 굳이 아래와 같은 과정을 거치지 않고도 편집을 더 빨리 진행할 수 있을 텐데 말이죠. 분명 다른 더 큰 매력이 SKT에 있었을 거라 생각은 합니다. SKT를 미워하는 게 아니랍니다.^^

"사실 제작 과정은 별로 스마트하지 않다. PD가 원고와 큐시트를 SKT 쪽에 보내면 관련 부서에서 AI 보이스 합성음을 만들어 KBS에 전달하고, 다시 PD가 편집해서 방송을 제작하는 ‘수동’ 공정이기 때문이다. "

2.
언론사람 4월호를 마감하고 나서... 지난 3월호에 기고한 글을 공유합니다. 별 내용은 없습니다. 정확히 말하자면 팩트의 한계라기보다는 맥락과 단절된 팩트의 한계로 이해해주시면 감사하겠습니다. 여기서 몇 번 드렸던 메시지기도 합니다.

"맥락과 결합되지 않은 팩트들, 사실여부조차 걸러지지 않은 작은 팩트들의 조각들이 트래픽 유발을 위해 과도하게 생산되면서 허위조작정보의 미끼가 되어 온 사실을 우리는 가볍게 여겨선 안된다. 그러한 유형의 기사량을 줄이되, 더 넓은 맥락이 첨부된 가치 있는 저널리즘 생산물에 집중하는 것이 허위조작정보의 유통을 조금이나마 덜어내는데 도움이 될 것이다. 그것이 가디언이나 르몽드처럼 수익의 위기 없이 더 많은 독자들을 신뢰의 브랜드 앞에 모이게 하는 묘안일 수 있다."
아래는 언론중재위원회가 매월 발행하는 언론사람 3월호에 제가 기고한 글입니다. 코로나19가 한창 확산될 무렵, 프랑스에서는 유전적, 인종적 특이성으로 인해 동양인들만이 코로나19에 감염된다는 소문이 떠돌았다. 어느 언론...

1.
(네이버 뉴스 댓글 개편) 늦었지만 환영. 앞으로 더 선제적으로 움직여주길 바랄 뿐입니다. 루머와 허위정보로부터 사용자들의 “정신건강”을 보호하기 위해서라도 말이죠.

3월18일

5.
이런 모션을 KBS 9시 뉴스 본방에서 보게 될 줄은 몰랐네요. 소셜 콘텐츠를 본방에 장식품처럼 끼워넣는 방식이 아니라 비중있는 분석 코너를 모션의 친근함이라는 장점을 살려서 젊은톤으로 구성한 게 참 인상적이었습니다. ‘지상파 KBS’ 9시 뉴스에도 이런 실험이 가능하군요.
90182932_2598666640366896_1664575826093408256_n

4.
Flourish의 Point-map 템플릿을 사용해서 확진자의 증가 속도가 얼마나 극적으로 치솟았는지를 확인할 수 있는 기사입니다. 플러리시는 오마이뉴스에 감사해야 할 듯.

3.
LATimes가 코로나바이러스19 팝업 계정을 인스타에 만들었습니다. 인스타 주력 사용자들에게 신뢰할 만한 뉴스를 제공하겠다는 의도입니다. 큰 사건이 터졌을 때 이렇게 별도 채널 혹은 계정을 개설해서 제공하는 시도들은 과거에도 여러 차례 있었습니다. 본 계정에 제공하는 것만으로는 한계가 있다 보니... 프로필 링크를 LATimes 코로나 특별면으로 연결시킨 것을 보면, Top of Funnel의 역할을 부여받은 것 같습니다. 이 기회를 활용해서 젊은 인스타그램 사용자들의 디지털 구독을 확대하겠다는 전략인 듯합니다.

어떠세요? 리소스가 많이 들어서 조금은 낭비일까요? 아니면 그때그때마다 팝업 계정을 운영해서 수익으로 연결시킬 수 있는 기회들을 꾸준하게 만드는 좋은 접근법일까요?

2.
컬럼비아 저널리즘 스쿨의 에밀리 벨은 이렇게 외칩니다.

"플랫폼은 지금 무엇을 해야 하는가? 그들은 게이트키퍼들이다. 그들의 책임은 현재 정보 스택(information stack) 전반에 걸쳐 있다. 그들은 이미 뉴스를 훨씬 더 엄격하게 편집 및 큐레이팅하고 있다. 프로모션할 수 있는 언론사의 수는 앞으로 훨씬 더 줄어들 것이다. 때문에 플랫폼은 지역 보도를 보호해야만 한다."

에밀리 벨이 조슈아 벤튼 니먼랩 기자의 전망에 대해 짧은 코멘트 및 액션 플랜을 자신의 트위터에 남겼습니다. 조슈아 벤튼은 코로나19로 인해 미국 내 지역언론사들의 상황이 매우 위기에 빠질 수 있다고 경고했습니다. 에밀.....

1.
급히 설문 하나만 또 도와주시면 안될지. 기자분들께 여쭙는 질문입니다. 화상 회의 툴 주로 어떤 걸 많이 쓰시는지 궁금하여.

3월17일

1.
부정확한 시각화 보도, 어떻게 해결할 수 있을까요? 개인적으론, 간단한 차트를 먼저 시각화 툴로 제작한 뒤에 디자이너에게 넘기거나 하는 게 어떨까라는 건데요. 언론사마다 시각화 담당자가 다르니 일괄적으로 적용할 수는 없을 것 같습니다만. 어떠세요?

참고로 제가 자주 사용하는 시각화 툴은

  1. 플러리쉬
    2 데이터래퍼
  2. 데이터 스튜디오
  3. 구글 시트의 차트

태블로(Tableu)나 하이차트(HighCharts) 등의 고급 툴들은 거의 써보진 못했습니다. ^^

3월16일

3.
딥페이크 이슈입니다. 관심 있는 분들 적지 않으시리라. 요즘 언론재단 보고서만 잘 챙겨 읽어도 상당히 유식해진다는 느낌입니다.^^ 감사합니다.

2.
혹시 약 40분 뒤인 오후 2시에 저랑 유튜브에서 잡담 나누실 분 계시나요? 테스트를 좀 해야 하는데, OBS로 유튜브 라이브를 한번도 해본 적이 없어서요. 어떤 느낌인지 확인하기 위해... 링크는 아래입니다. 혹 시간 되시는 분들 2시에 뵙겠습니다. 다들 바쁘신 건 잘 알고 있답니다.^^

https://www.youtube.com/watch?v=xwMWEnVrdlM

1.
아마 다들 이 소식 들으셨을 텐데요. 글로벌 플랫폼은 아시다시피 IFCN과 많이들 협력하고 있습니다. 페이스북도 구글도 마찬가지입니다.

현재 IFCN 인증 언론사는 국내에 JTBC밖에 없습니다. 허들이 제법 높은데요.(사실 저널리즘의 기본 윤리라는 관점에서 보면 상식적이라고 저는 보는 쪽입니다만)

결국 페이스북이든 다른 플랫폼이든 협업의 매개는 IFCN를 거칠 것으로 보이는데요. 국내 언론사들도 이 인증을 얻기 위해 도전하는 경우가 많나요? 물론 많았으면 하는데요. 만약 신청을 하고 도전을 하게 된다면 어떤 동기로 신청하게 될까요? (조금이나마 도움이 될 수 있었으면 하는 바람인지라)

"IFCN 인증 받으면 뭐가 좋아지는데?" 라고 언론사 내 리더들이 질문하게 되면 어떤 답을 제시하는 게 설득력이 있을까요? 의견 좀 부탁을 드립니다.

3월15일

원고 하나를 마감해야 할 일이 있어서 아래 논문을 읽고 있는데요. 요약하자면 시빅해커(여기선 주로 시빅 테크놀로지스트라고 표현하지만)들의 활동이 데이터 저널리즘을 보완하거나 확장하는데 도움을 주고 있다는 연구입니다. 둘의 뒤얽힘이 지니는 긍정적 효과에 주목하고 있는 것이죠.

코로나19 국면에서 국내 시빅해커들의 활약이 언론 등을 통해 자주 소개되는데요. 국내 데이터 저널리즘과의 협업 지점을 발견해서 그 에너지를 함께 집약해본다면 더 의미있는 공적 가치를 만들어낼 수 있지 않을까 그런 아름다운 상상을 해봤습니다.

그냥 글 쓰다 여기에 남깁니다.

Data Journalism Beyond Legacy Media: The case of African and European Civic Technology Organizations