친해져요 전공영어

(통계) Simpson

통계Simpson's paradox

Key Points
  • 심슨의 역설은 세부 데이터에서 드러나는 경향이나 결과가 전체적으로는 사라지거나 오히려 그 반대로 나타나는 현상을 말한다.
Key Words
  • Statistics
  • Simpson's paradox
  • Lurking variables
  • Hidden variables
대화문은 AI 음성 파일로 구성되었습니다.
Hey, Jihoon, have you checked out the statistics on the pros and cons of the new policy? It’s a bit strange. I feel like there might be an issue with the data.
Perhaps. You know, we shouldn’t blindly rely on statistics, even though many people tend to trust numbers. For example, there’s this phenomenon called Simpson’s paradox.
Simpson’s paradox? You’re not talking about the famous animation, right?
Haha, no, not the animation. Simpson's paradox is actually a statistical phenomenon where trends or results that appear in different groups disappear or even reverse when the groups are combined.
Sounds interesting. Can you explain it in more detail?
Sure. UC Berkeley was in trouble as its overall graduate school statistics showed a higher acceptance rate for males than females. However, upon closer examination at the department level, there was a statistically significant gender bias in favor of women!
That’s incredible. How could that be possible?
They found out that women often applied to departments with a lower overall acceptance rate. This hidden variable influenced the individual department acceptance rates, causing the trend seen in the overall data to flip.
So, you mean, when we take that hidden factors into account or change our perspectives, it reversed the trend we thought existed in the data, right?
Exactly. And that's why looking at the bigger picture is crucial. Sometimes, the real story is hidden in the details.
Wow, that's a good lesson. It makes me realize how important it is to approach statistical data with a critical mind.
Absolutely. We need to be aware of lurking variables and always consider the context. Otherwise, we can be deceived by people who might use statistics to push their own agendas.
지훈아, 새로운 정책에 대한 찬반의견 통계를 봤어? 좀 이상해. 데이터에 문제가 있는 것 같아.
어쩌면 그럴지도 몰라. 알다시피, 많은 사람들이 숫자를 신뢰하지만 통계에 무작정 의존해서는 안돼. 예를 들어, 심슨의 역설이라는 현상이 있어.
심슨의 역설이라고? 유명한 만화 이야기 하는 건 아니지?
하하, 아니야. 만화 이야기가 아냐. 심슨의 역설은 사실 통계적 현상인데 각기 다른 그룹에서 나타나는 어떤 추세나 결과가 그 그룹들이 통합되면 사라지거나 심지어는 그 반대로 나타나는 것을 말해.
흥미롭네. 더 자세히 이야기 해 줄래?
물론이지. 버클리 대학은 전반적인 대학원 입학률이 남성이 여성보다 높게 나와서 곤란한 처지에 있었어. 그러나 학과 수준에서 더 자세히 살펴보니, 여성에게 더 치우쳐진 성별 편향이 있었던 거야.
믿기 어려운 이야기네. 어떻게 그렇게 된거야?
그들은 여성들이 대체로 전반적인 입학률이 낮은 학과에 지원하는 경향이 있다는 사실을 발견 했어. 이 숨겨진 변수가 개별 학과의 입학률에 영향을 미치면서 전반적인 데이터에서 보이는 추세가 뒤집히게 됐던 거야.
그러니까 네 말은, 숨겨진 요인을 고려하거나 관점을 바꾸면 우리가 데이터에 있다고 생각했던 경향이 뒤집힌다는 거지?
정확해. 그리고 그래서 큰 그림을 보는 것이 중요한 거야. 때때로 진짜 이야기는 세부적인 것에 숨겨져 있거든.
와, 좋은 교훈을 얻었네. 통계 데이터에는 비판적으로 접근하는 것이 얼마나 중요한지 깨닫게 되었어.
정말 그래. 숨겨진 변수를 알아차리고 항상 맥락을 고려하는 것이 필요해. 그렇지 않으면, 통계를 사용해서 자신의 의사를 밀어 부치는 사람들에게 속을 수 있어.

Words & Expressions

  • statistics : n. 통계
  • pros and cons : 찬반 양론
  • policy : n. 정책
  • blindly : adv. 맹목적으로, 무턱대로
  • rely on : 의존하다
  • tend to : ~하는 경향이 있다
  • phenomenon : n. 현상
  • Simpson’s paradox : 심슨의 역설
  • statistical : a. 통계의
  • trend : n. 경향, 추세
  • appear : v. 나타나다
  • reverse : v. 뒤바꾸다
  • combine : v. 결합하다
  • overall : a. 전반적인
  • graduate school : 대학원
  • acceptance rate : 입학률
  • examination : n. 조사, 검사
  • department : n. 학부
  • statistically : adv. 통계적으로
  • significant : a. 유의미한
  • gender bias : 성별 편향
  • in favor of : ~의 이익이 되도록
  • apply : v. 지원하다
  • hidden variable : 숨은 변수
  • individual : a. 각각의
  • flip : v. 홱 뒤집다
  • take into account : ~을 고려하다
  • perspective : n. 관점, 시각
  • lurking variable : 잠복, 변수
  • context : n. 맥락
  • be deceived : 속다
  • agenda : n. 의제
You know, we shouldn't blindly rely on statistics, even though many people tend to trust numbers.
  • should not은 '~해서는 안된다'의 의미로 도덕적 의무나 충고를 나타낸다. even though는 '비록 ~일지라도'라는 의미이며 양보의 부사절을 이끈다.
Simpson's paradox is actually a statistical phenomenon where trends or results that appear in different groups disappear or even reverse when the groups are conbined.
  • where이 이끄는 관계절은 선행사인 a statistical phenomenon을 수식한다. 또한 관계대명사 that이 이끄는 관계절은 중간에 삽입되어 선행사 trends or results를 수식하며, 관계부사 where이 이끄는 관계절 안에서 주어는 trends or results, 동사는 disappear 와 reverse이다.
They found out that women often applied to departments with a lower overall acceptance rate.
  • 명사절 접속사 that이 이끄는 문장은 동사 found out의 목적어 역할을 한다.
This hidden variable influenced the individual department acceptance rates, causing the trend seen in the overall data to flip.
  • causing 이하는 분사구문으로, 이를 바꾸어 쓰면 and it caused the trend seen in the overall data to flip. 과 같이 바꾸어 쓸 수 있다. seen은 분사이며 the trend를 뒤에서 수식한다.
It makes me realize how important it is to approach statistical data with a critical mind.
  • make는 사역동사이며 [make+목적어-원형부정사]의 구문으로 사용된다. how important it is ~ 이하는 명사절로, realize의 목적어 역할을 한다.