<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ko">
	<id>http://samediff.kr/wiki/index.php?action=history&amp;feed=atom&amp;title=LDA</id>
	<title>LDA - 편집 역사</title>
	<link rel="self" type="application/atom+xml" href="http://samediff.kr/wiki/index.php?action=history&amp;feed=atom&amp;title=LDA"/>
	<link rel="alternate" type="text/html" href="http://samediff.kr/wiki/index.php?title=LDA&amp;action=history"/>
	<updated>2026-04-27T18:37:54Z</updated>
	<subtitle>이 문서의 편집 역사</subtitle>
	<generator>MediaWiki 1.34.0</generator>
	<entry>
		<id>http://samediff.kr/wiki/index.php?title=LDA&amp;diff=13575&amp;oldid=prev</id>
		<title>Admin: /* 지금까지 이해한 바로는, */</title>
		<link rel="alternate" type="text/html" href="http://samediff.kr/wiki/index.php?title=LDA&amp;diff=13575&amp;oldid=prev"/>
		<updated>2017-08-02T13:36:37Z</updated>

		<summary type="html">&lt;p&gt;&lt;span dir=&quot;auto&quot;&gt;&lt;span class=&quot;autocomment&quot;&gt;지금까지 이해한 바로는,&lt;/span&gt;&lt;/span&gt;&lt;/p&gt;
&lt;table class=&quot;diff diff-contentalign-left&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;ko&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;← 이전 판&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;2017년 8월 2일 (수) 13:36 판&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l24&quot; &gt;24번째 줄:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;24번째 줄:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;gibbs로 iteration을 많이 돌면 최적점에 수렴한다고 확신할 수 있는지 궁금한데, 그 증명은 못찾아보겠다. &amp;lt;del&amp;gt;dirichlet distribution이 unimodality[https://en.wikipedia.org/wiki/Unimodality]를 보장하면 되는건가(혹은 그 반대인가) 싶다가도.. 그냥 모르겠음. 말하자면 뭔가 solution을 찾기엔 rank가 부족하다는 느낌이 있다. &amp;lt;/del&amp;gt;&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;gibbs로 iteration을 많이 돌면 최적점에 수렴한다고 확신할 수 있는지 궁금한데, 그 증명은 못찾아보겠다. &amp;lt;del&amp;gt;dirichlet distribution이 unimodality[https://en.wikipedia.org/wiki/Unimodality]를 보장하면 되는건가(혹은 그 반대인가) 싶다가도.. 그냥 모르겠음. 말하자면 뭔가 solution을 찾기엔 rank가 부족하다는 느낌이 있다. &amp;lt;/del&amp;gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;====지금까지 이해한 바로는,====  &lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;====지금까지 이해한 바로는,====  &lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;−&lt;/td&gt;&lt;td style=&quot;color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;이 추정의 결과가 거의 항상 일치할 수 있는 이유는 단어가 document로 묶여있기 때문. hyperparameter를 모두 1보다 작게(위의 예시에서도 \(\alpha=0.1, \beta=0.001\)주었음)주면 각 단어가 가질 수 있는 주제가 &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;'rich &lt;/del&gt;get &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;richer' &lt;/del&gt;fashion으로 모이게 되어 있다. 주제별 단어분포에서 몇개의 단어가 dominant해진다는 얘기. document의 주제도 마찬가지다. 극단적인 경우, 주제 하나가 단어 하나만 가지고, 문서 하나도 하나의 주제만 100% 가지게 될 것이다. 애초 랜덤하게 단어마다 주제를 배치하면 단어의 주제나, 문서의 주제도 거의 균일하게 퍼져 있게 되어 있어서 여기에 sparcity를 가하는(\(\alpha, \beta\)를 가해서 sampling and reassign하는) 과정에서 한 문서 안에 묶인 단어들이 되도록 같은 주제를 가지도록 단어별 주제분포가 따라서 변한다. 곧, 허락하는 한 가장 극단적으로 entropy를 낮춘다는 얘기. (위키에 entropy항목[https://en.wikipedia.org/wiki/Dirichlet_distribution#Entropy]이 있는데 이건 또 무슨소린지 모를 소리만 몇줄 ㅋㅋ ) 따라서 document가 '실제'로 존재하는 문서들처럼 단어를 균일하게(이래야 너무 극단적인 분포를 가지는 것을 막아준다), 그리고 적당하게 불균일하게(주제에 편향된 단어분포를 가질 것이므로) 가지고 있지 않고, 어떤식으로든 조작되어 있다면 (결국, LDA적용 이후상태라면… -_- ) 잘 동작하지 않을 것이다. &amp;lt;del&amp;gt;관찰되는 document의 양이 많을수록 유리한, 그러니까 실제로 써먹으려면 양질의 데이터가 어느정도 있어주어야 한다는 뜻.&amp;lt;/del&amp;gt;&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;이 추정의 결과가 거의 항상 일치할 수 있는 이유는 단어가 document로 묶여있기 때문. hyperparameter를 모두 1보다 작게(위의 예시에서도 \(\alpha=0.1, \beta=0.001\)주었음)주면 각 단어가 가질 수 있는 주제가 &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;‘rich &lt;/ins&gt;get &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;richer’ &lt;/ins&gt;fashion으로 모이게 되어 있다. 주제별 단어분포에서 몇개의 단어가 dominant해진다는 얘기. document의 주제도 마찬가지다. 극단적인 경우, 주제 하나가 단어 하나만 가지고, 문서 하나도 하나의 주제만 100% 가지게 될 것이다. 애초 랜덤하게 단어마다 주제를 배치하면 단어의 주제나, 문서의 주제도 거의 균일하게 퍼져 있게 되어 있어서 여기에 sparcity를 가하는(\(\alpha, \beta\)를 가해서 sampling and reassign하는) 과정에서 한 문서 안에 묶인 단어들이 되도록 같은 주제를 가지도록 단어별 주제분포가 따라서 변한다. 곧, 허락하는 한 가장 극단적으로 entropy를 낮춘다는 얘기. (위키에 entropy항목[https://en.wikipedia.org/wiki/Dirichlet_distribution#Entropy]이 있는데 이건 또 무슨소린지 모를 소리만 몇줄 ㅋㅋ ) 따라서 document가 '실제'로 존재하는 문서들처럼 단어를 균일하게(이래야 너무 극단적인 분포를 가지는 것을 막아준다), 그리고 적당하게 불균일하게(주제에 편향된 단어분포를 가질 것이므로) 가지고 있지 않고, 어떤식으로든 조작되어 있다면 (결국, LDA적용 이후상태라면… -_- ) 잘 동작하지 않을 것이다. &amp;lt;del&amp;gt;관찰되는 document의 양이 많을수록 유리한, 그러니까 실제로 써먹으려면 양질의 데이터가 어느정도 있어주어야 한다는 뜻.&amp;lt;/del&amp;gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Admin</name></author>
		
	</entry>
	<entry>
		<id>http://samediff.kr/wiki/index.php?title=LDA&amp;diff=13574&amp;oldid=prev</id>
		<title>Admin: /* 지금까지 이해한 바로는, */</title>
		<link rel="alternate" type="text/html" href="http://samediff.kr/wiki/index.php?title=LDA&amp;diff=13574&amp;oldid=prev"/>
		<updated>2017-08-02T13:36:02Z</updated>

		<summary type="html">&lt;p&gt;&lt;span dir=&quot;auto&quot;&gt;&lt;span class=&quot;autocomment&quot;&gt;지금까지 이해한 바로는,&lt;/span&gt;&lt;/span&gt;&lt;/p&gt;
&lt;table class=&quot;diff diff-contentalign-left&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;ko&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;← 이전 판&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;2017년 8월 2일 (수) 13:36 판&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l24&quot; &gt;24번째 줄:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;24번째 줄:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;gibbs로 iteration을 많이 돌면 최적점에 수렴한다고 확신할 수 있는지 궁금한데, 그 증명은 못찾아보겠다. &amp;lt;del&amp;gt;dirichlet distribution이 unimodality[https://en.wikipedia.org/wiki/Unimodality]를 보장하면 되는건가(혹은 그 반대인가) 싶다가도.. 그냥 모르겠음. 말하자면 뭔가 solution을 찾기엔 rank가 부족하다는 느낌이 있다. &amp;lt;/del&amp;gt;&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;gibbs로 iteration을 많이 돌면 최적점에 수렴한다고 확신할 수 있는지 궁금한데, 그 증명은 못찾아보겠다. &amp;lt;del&amp;gt;dirichlet distribution이 unimodality[https://en.wikipedia.org/wiki/Unimodality]를 보장하면 되는건가(혹은 그 반대인가) 싶다가도.. 그냥 모르겠음. 말하자면 뭔가 solution을 찾기엔 rank가 부족하다는 느낌이 있다. &amp;lt;/del&amp;gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;====지금까지 이해한 바로는,====  &lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;====지금까지 이해한 바로는,====  &lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;−&lt;/td&gt;&lt;td style=&quot;color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;이 추정의 결과가 거의 항상 일치할 수 있는 이유는 단어가 document로 묶여있기 때문. hyperparameter를 모두 1보다 작게(위의 예시에서도 \(\alpha=0.1, \beta=0.001\)주었음)주면 각 단어가 가질 수 있는 주제가 'rich get richer' fashion으로 모이게 되어 있다. 주제별 단어분포에서 몇개의 단어가 dominant해진다는 얘기. document의 주제도 마찬가지다. 극단적인 경우, 주제 하나가 단어 하나만 가지고, 문서 하나도 하나의 주제만 100% 가지게 될 것이다. 애초 랜덤하게 단어마다 주제를 배치하면 단어의 주제나, 문서의 주제도 거의 균일하게 퍼져 있게 되어 있어서 여기에 sparcity를 가하는(\(\alpha, \beta\)를 가해서 sampling and reassign하는) 과정에서 한 문서 안에 묶인 단어들이 되도록 같은 주제를 가지도록 단어별 주제분포가 따라서 변한다. 곧, 허락하는 한 가장 극단적으로 entropy를 낮춘다는 얘기. &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;&amp;lt;del&amp;gt;&lt;/del&gt;(위키에 entropy항목[https://en.wikipedia.org/wiki/Dirichlet_distribution#Entropy]이 있는데 이건 또 무슨소린지 모를 소리만 몇줄 ㅋㅋ )&lt;del class=&quot;diffchange diffchange-inline&quot;&gt;&amp;lt;/del&amp;gt; &lt;/del&gt;따라서 document가 '실제'로 존재하는 문서들처럼 단어를 균일하게(이래야 너무 극단적인 분포를 가지는 것을 막아준다), 그리고 적당하게 불균일하게(주제에 편향된 단어분포를 가질 것이므로) 가지고 있지 않고, 어떤식으로든 조작되어 있다면&lt;del class=&quot;diffchange diffchange-inline&quot;&gt;&amp;lt;del&amp;gt;&lt;/del&gt;(결국, LDA적용 이후상태라면… -_- )&lt;del class=&quot;diffchange diffchange-inline&quot;&gt;&amp;lt;/del&amp;gt; &lt;/del&gt;잘 동작하지 않을 것이다. &amp;lt;del&amp;gt;관찰되는 document의 양이 많을수록 유리한, 그러니까 실제로 써먹으려면 양질의 데이터가 어느정도 있어주어야 한다는 뜻.&amp;lt;/del&amp;gt;&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;이 추정의 결과가 거의 항상 일치할 수 있는 이유는 단어가 document로 묶여있기 때문. hyperparameter를 모두 1보다 작게(위의 예시에서도 \(\alpha=0.1, \beta=0.001\)주었음)주면 각 단어가 가질 수 있는 주제가 'rich get richer' fashion으로 모이게 되어 있다. 주제별 단어분포에서 몇개의 단어가 dominant해진다는 얘기. document의 주제도 마찬가지다. 극단적인 경우, 주제 하나가 단어 하나만 가지고, 문서 하나도 하나의 주제만 100% 가지게 될 것이다. 애초 랜덤하게 단어마다 주제를 배치하면 단어의 주제나, 문서의 주제도 거의 균일하게 퍼져 있게 되어 있어서 여기에 sparcity를 가하는(\(\alpha, \beta\)를 가해서 sampling and reassign하는) 과정에서 한 문서 안에 묶인 단어들이 되도록 같은 주제를 가지도록 단어별 주제분포가 따라서 변한다. 곧, 허락하는 한 가장 극단적으로 entropy를 낮춘다는 얘기. (위키에 entropy항목[https://en.wikipedia.org/wiki/Dirichlet_distribution#Entropy]이 있는데 이건 또 무슨소린지 모를 소리만 몇줄 ㅋㅋ ) 따라서 document가 '실제'로 존재하는 문서들처럼 단어를 균일하게(이래야 너무 극단적인 분포를 가지는 것을 막아준다), 그리고 적당하게 불균일하게(주제에 편향된 단어분포를 가질 것이므로) 가지고 있지 않고, 어떤식으로든 조작되어 있다면 (결국, LDA적용 이후상태라면… -_- ) 잘 동작하지 않을 것이다. &amp;lt;del&amp;gt;관찰되는 document의 양이 많을수록 유리한, 그러니까 실제로 써먹으려면 양질의 데이터가 어느정도 있어주어야 한다는 뜻.&amp;lt;/del&amp;gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Admin</name></author>
		
	</entry>
	<entry>
		<id>http://samediff.kr/wiki/index.php?title=LDA&amp;diff=13573&amp;oldid=prev</id>
		<title>Admin: /* 지금까지 이해한 바로는, */</title>
		<link rel="alternate" type="text/html" href="http://samediff.kr/wiki/index.php?title=LDA&amp;diff=13573&amp;oldid=prev"/>
		<updated>2017-08-02T13:35:26Z</updated>

		<summary type="html">&lt;p&gt;&lt;span dir=&quot;auto&quot;&gt;&lt;span class=&quot;autocomment&quot;&gt;지금까지 이해한 바로는,&lt;/span&gt;&lt;/span&gt;&lt;/p&gt;
&lt;table class=&quot;diff diff-contentalign-left&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;ko&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;← 이전 판&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;2017년 8월 2일 (수) 13:35 판&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l24&quot; &gt;24번째 줄:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;24번째 줄:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;gibbs로 iteration을 많이 돌면 최적점에 수렴한다고 확신할 수 있는지 궁금한데, 그 증명은 못찾아보겠다. &amp;lt;del&amp;gt;dirichlet distribution이 unimodality[https://en.wikipedia.org/wiki/Unimodality]를 보장하면 되는건가(혹은 그 반대인가) 싶다가도.. 그냥 모르겠음. 말하자면 뭔가 solution을 찾기엔 rank가 부족하다는 느낌이 있다. &amp;lt;/del&amp;gt;&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;gibbs로 iteration을 많이 돌면 최적점에 수렴한다고 확신할 수 있는지 궁금한데, 그 증명은 못찾아보겠다. &amp;lt;del&amp;gt;dirichlet distribution이 unimodality[https://en.wikipedia.org/wiki/Unimodality]를 보장하면 되는건가(혹은 그 반대인가) 싶다가도.. 그냥 모르겠음. 말하자면 뭔가 solution을 찾기엔 rank가 부족하다는 느낌이 있다. &amp;lt;/del&amp;gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;====지금까지 이해한 바로는,====  &lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;====지금까지 이해한 바로는,====  &lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;−&lt;/td&gt;&lt;td style=&quot;color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;이 추정의 결과가 거의 항상 일치할 수 있는 이유는 단어가 document로 묶여있기 때문. hyperparameter를 모두 1보다 작게(위의 예시에서도 \(\alpha=0.1, \beta=0.001\)주었음)주면 각 단어가 가질 수 있는 주제가 'rich get richer' fashion으로 모이게 되어 있다. 주제별 단어분포에서 몇개의 단어가 dominant해진다는 얘기. document의 주제도 마찬가지다. 극단적인 경우, 주제 하나가 단어 하나만 가지고, 문서 하나도 하나의 주제만 100% 가지게 될 것이다. 애초 랜덤하게 단어마다 주제를 배치하면 단어의 주제나, 문서의 주제도 거의 균일하게 퍼져 있게 되어 있어서 여기에 sparcity를 가하는(\(\alpha, \beta\)를 가해서 sampling and reassign하는) 과정에서 한 문서 안에 묶인 단어들이 되도록 같은 주제를 가지도록 단어별 주제분포가 따라서 변한다. 곧, 허락하는 한 가장 극단적으로 entropy를 낮춘다는 얘기. &amp;lt;del&amp;gt;(위키에 entropy항목[https://en.wikipedia.org/wiki/Dirichlet_distribution#Entropy]이 있는데 이건 또 무슨소린지 모를 소리만 몇줄 ㅋㅋ )&amp;lt;/del&amp;gt; 따라서 document가 '실제'로 존재하는 문서들처럼 단어를 균일하게(이래야 너무 극단적인 분포를 가지는 것을 막아준다), 그리고 적당하게 불균일하게(주제에 편향된 단어분포를 가질 것이므로) 가지고 있지 않고, 어떤식으로든 조작되어 있다면&amp;lt;del&amp;gt;(결국, LDA적용 이후상태라면… -_- )&amp;lt;/del&amp;gt; 잘 동작하지 않을 것이다. 관찰되는 document의 양이 많을수록 유리한, 그러니까 실제로 써먹으려면 양질의 데이터가 어느정도 있어주어야 한다는 뜻.&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;이 추정의 결과가 거의 항상 일치할 수 있는 이유는 단어가 document로 묶여있기 때문. hyperparameter를 모두 1보다 작게(위의 예시에서도 \(\alpha=0.1, \beta=0.001\)주었음)주면 각 단어가 가질 수 있는 주제가 'rich get richer' fashion으로 모이게 되어 있다. 주제별 단어분포에서 몇개의 단어가 dominant해진다는 얘기. document의 주제도 마찬가지다. 극단적인 경우, 주제 하나가 단어 하나만 가지고, 문서 하나도 하나의 주제만 100% 가지게 될 것이다. 애초 랜덤하게 단어마다 주제를 배치하면 단어의 주제나, 문서의 주제도 거의 균일하게 퍼져 있게 되어 있어서 여기에 sparcity를 가하는(\(\alpha, \beta\)를 가해서 sampling and reassign하는) 과정에서 한 문서 안에 묶인 단어들이 되도록 같은 주제를 가지도록 단어별 주제분포가 따라서 변한다. 곧, 허락하는 한 가장 극단적으로 entropy를 낮춘다는 얘기. &amp;lt;del&amp;gt;(위키에 entropy항목[https://en.wikipedia.org/wiki/Dirichlet_distribution#Entropy]이 있는데 이건 또 무슨소린지 모를 소리만 몇줄 ㅋㅋ )&amp;lt;/del&amp;gt; 따라서 document가 '실제'로 존재하는 문서들처럼 단어를 균일하게(이래야 너무 극단적인 분포를 가지는 것을 막아준다), 그리고 적당하게 불균일하게(주제에 편향된 단어분포를 가질 것이므로) 가지고 있지 않고, 어떤식으로든 조작되어 있다면&amp;lt;del&amp;gt;(결국, LDA적용 이후상태라면… -_- )&amp;lt;/del&amp;gt; 잘 동작하지 않을 것이다. &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;&amp;lt;del&amp;gt;&lt;/ins&gt;관찰되는 document의 양이 많을수록 유리한, 그러니까 실제로 써먹으려면 양질의 데이터가 어느정도 있어주어야 한다는 뜻.&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;&amp;lt;/del&amp;gt;&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Admin</name></author>
		
	</entry>
	<entry>
		<id>http://samediff.kr/wiki/index.php?title=LDA&amp;diff=13572&amp;oldid=prev</id>
		<title>Admin: /* 지금까지 이해한 바로는, */</title>
		<link rel="alternate" type="text/html" href="http://samediff.kr/wiki/index.php?title=LDA&amp;diff=13572&amp;oldid=prev"/>
		<updated>2017-08-02T13:34:31Z</updated>

		<summary type="html">&lt;p&gt;&lt;span dir=&quot;auto&quot;&gt;&lt;span class=&quot;autocomment&quot;&gt;지금까지 이해한 바로는,&lt;/span&gt;&lt;/span&gt;&lt;/p&gt;
&lt;table class=&quot;diff diff-contentalign-left&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;ko&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;← 이전 판&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;2017년 8월 2일 (수) 13:34 판&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l24&quot; &gt;24번째 줄:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;24번째 줄:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;gibbs로 iteration을 많이 돌면 최적점에 수렴한다고 확신할 수 있는지 궁금한데, 그 증명은 못찾아보겠다. &amp;lt;del&amp;gt;dirichlet distribution이 unimodality[https://en.wikipedia.org/wiki/Unimodality]를 보장하면 되는건가(혹은 그 반대인가) 싶다가도.. 그냥 모르겠음. 말하자면 뭔가 solution을 찾기엔 rank가 부족하다는 느낌이 있다. &amp;lt;/del&amp;gt;&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;gibbs로 iteration을 많이 돌면 최적점에 수렴한다고 확신할 수 있는지 궁금한데, 그 증명은 못찾아보겠다. &amp;lt;del&amp;gt;dirichlet distribution이 unimodality[https://en.wikipedia.org/wiki/Unimodality]를 보장하면 되는건가(혹은 그 반대인가) 싶다가도.. 그냥 모르겠음. 말하자면 뭔가 solution을 찾기엔 rank가 부족하다는 느낌이 있다. &amp;lt;/del&amp;gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;====지금까지 이해한 바로는,====  &lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;====지금까지 이해한 바로는,====  &lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;−&lt;/td&gt;&lt;td style=&quot;color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;이 추정의 결과가 거의 항상 일치할 수 있는 이유는 단어가 document로 묶여있기 때문. hyperparameter를 모두 1보다 작게(위의 예시에서도 \(\alpha=0.1, \beta=0.001\)주었음)주면 각 단어가 가질 수 있는 주제가 'rich get richer' fashion으로 모이게 되어 있다. 주제별 단어분포에서 몇개의 단어가 dominant해진다는 얘기. document의 주제도 마찬가지다. 극단적인 경우, 주제 하나가 단어 하나만 가지고, 문서 하나도 하나의 주제만 100% 가지게 될 것이다. 애초 랜덤하게 단어마다 주제를 배치하면 단어의 주제나, 문서의 주제도 거의 균일하게 퍼져 있게 되어 있어서 여기에 sparcity를 가하는(\(\alpha, \beta\)를 가해서 sampling and reassign하는) 과정에서 한 문서 안에 묶인 단어들이 되도록 같은 주제를 가지도록 단어별 주제분포가 따라서 변한다. 곧, 허락하는 한 가장 극단적으로 entropy를 낮춘다는 얘기. &amp;lt;del&amp;gt;(위키에 entropy항목[https://en.wikipedia.org/wiki/Dirichlet_distribution#Entropy]이 있는데 이건 또 무슨소린지 모를 소리만 몇줄 ㅋㅋ )&amp;lt;/del&amp;gt; 따라서 document가 '실제'로 존재하는 문서들처럼 단어를 균일하게(이래야 너무 극단적인 분포를 가지는 것을 막아준다), 그리고 적당하게 불균일하게(주제에 편향된 단어분포를 가질 것이므로) 가지고 있지 않고, 어떤식으로든 조작되어 있다면 잘 동작하지 않을 것이다. 관찰되는 document의 양이 많을수록 유리한, 그러니까 실제로 써먹으려면 양질의 데이터가 어느정도 있어주어야 한다는 뜻.&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;이 추정의 결과가 거의 항상 일치할 수 있는 이유는 단어가 document로 묶여있기 때문. hyperparameter를 모두 1보다 작게(위의 예시에서도 \(\alpha=0.1, \beta=0.001\)주었음)주면 각 단어가 가질 수 있는 주제가 'rich get richer' fashion으로 모이게 되어 있다. 주제별 단어분포에서 몇개의 단어가 dominant해진다는 얘기. document의 주제도 마찬가지다. 극단적인 경우, 주제 하나가 단어 하나만 가지고, 문서 하나도 하나의 주제만 100% 가지게 될 것이다. 애초 랜덤하게 단어마다 주제를 배치하면 단어의 주제나, 문서의 주제도 거의 균일하게 퍼져 있게 되어 있어서 여기에 sparcity를 가하는(\(\alpha, \beta\)를 가해서 sampling and reassign하는) 과정에서 한 문서 안에 묶인 단어들이 되도록 같은 주제를 가지도록 단어별 주제분포가 따라서 변한다. 곧, 허락하는 한 가장 극단적으로 entropy를 낮춘다는 얘기. &amp;lt;del&amp;gt;(위키에 entropy항목[https://en.wikipedia.org/wiki/Dirichlet_distribution#Entropy]이 있는데 이건 또 무슨소린지 모를 소리만 몇줄 ㅋㅋ )&amp;lt;/del&amp;gt; 따라서 document가 '실제'로 존재하는 문서들처럼 단어를 균일하게(이래야 너무 극단적인 분포를 가지는 것을 막아준다), 그리고 적당하게 불균일하게(주제에 편향된 단어분포를 가질 것이므로) 가지고 있지 않고, 어떤식으로든 조작되어 있다면&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;&amp;lt;del&amp;gt;(결국, LDA적용 이후상태라면… -_- )&amp;lt;/del&amp;gt; &lt;/ins&gt;잘 동작하지 않을 것이다. 관찰되는 document의 양이 많을수록 유리한, 그러니까 실제로 써먹으려면 양질의 데이터가 어느정도 있어주어야 한다는 뜻.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Admin</name></author>
		
	</entry>
	<entry>
		<id>http://samediff.kr/wiki/index.php?title=LDA&amp;diff=12564&amp;oldid=prev</id>
		<title>Admin: /* 지금까지 이해한 바로는, */</title>
		<link rel="alternate" type="text/html" href="http://samediff.kr/wiki/index.php?title=LDA&amp;diff=12564&amp;oldid=prev"/>
		<updated>2017-07-05T02:13:20Z</updated>

		<summary type="html">&lt;p&gt;&lt;span dir=&quot;auto&quot;&gt;&lt;span class=&quot;autocomment&quot;&gt;지금까지 이해한 바로는,&lt;/span&gt;&lt;/span&gt;&lt;/p&gt;
&lt;table class=&quot;diff diff-contentalign-left&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;ko&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;← 이전 판&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;2017년 7월 5일 (수) 02:13 판&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l24&quot; &gt;24번째 줄:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;24번째 줄:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;gibbs로 iteration을 많이 돌면 최적점에 수렴한다고 확신할 수 있는지 궁금한데, 그 증명은 못찾아보겠다. &amp;lt;del&amp;gt;dirichlet distribution이 unimodality[https://en.wikipedia.org/wiki/Unimodality]를 보장하면 되는건가(혹은 그 반대인가) 싶다가도.. 그냥 모르겠음. 말하자면 뭔가 solution을 찾기엔 rank가 부족하다는 느낌이 있다. &amp;lt;/del&amp;gt;&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;gibbs로 iteration을 많이 돌면 최적점에 수렴한다고 확신할 수 있는지 궁금한데, 그 증명은 못찾아보겠다. &amp;lt;del&amp;gt;dirichlet distribution이 unimodality[https://en.wikipedia.org/wiki/Unimodality]를 보장하면 되는건가(혹은 그 반대인가) 싶다가도.. 그냥 모르겠음. 말하자면 뭔가 solution을 찾기엔 rank가 부족하다는 느낌이 있다. &amp;lt;/del&amp;gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;====지금까지 이해한 바로는,====  &lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;====지금까지 이해한 바로는,====  &lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;−&lt;/td&gt;&lt;td style=&quot;color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;이 추정의 결과가 거의 항상 일치할 수 있는 이유는 단어가 document로 묶여있기 때문. hyperparameter를 모두 1보다 작게(위의 예시에서도 \(\alpha=0.1, \beta=0.001\)주었음)주면 각 단어가 가질 수 있는 주제가 'rich get richer' fashion으로 모이게 되어 있다. 주제별 단어분포에서 몇개의 단어가 dominant해진다는 얘기. document의 주제도 마찬가지다. 극단적인 경우, 주제 하나가 단어 하나만 가지고, 문서 하나도 하나의 주제만 100% 가지게 될 것이다. 애초 랜덤하게 단어마다 주제를 배치하면 단어의 주제나, 문서의 주제도 거의 균일하게 퍼져 있게 되어 있어서 여기에 sparcity를 가하는(\(\alpha, \beta\)를 가해서 sampling and reassign하는) 과정에서 한 문서 안에 묶인 단어들이 되도록 같은 주제를 가지도록 단어별 주제분포가 따라서 변한다. 곧, 허락하는 한 가장 극단적으로 entropy를 낮춘다는 얘기. (위키에 entropy항목[https://en.wikipedia.org/wiki/Dirichlet_distribution#Entropy]이 있는데 이건 또 무슨소린지 모를 소리만 몇줄 ㅋㅋ ) 따라서 document가 '실제'로 존재하는 문서들처럼 단어를 균일하게(이래야 너무 극단적인 분포를 가지는 것을 막아준다), 그리고 적당하게 불균일하게(주제에 편향된 단어분포를 가질 것이므로) 가지고 있지 않고, 어떤식으로든 조작되어 있다면 잘 동작하지 않을 것이다. 관찰되는 document의 양이 많을수록 유리한, 그러니까 실제로 써먹으려면 양질의 데이터가 어느정도 있어주어야 한다는 뜻.&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;이 추정의 결과가 거의 항상 일치할 수 있는 이유는 단어가 document로 묶여있기 때문. hyperparameter를 모두 1보다 작게(위의 예시에서도 \(\alpha=0.1, \beta=0.001\)주었음)주면 각 단어가 가질 수 있는 주제가 'rich get richer' fashion으로 모이게 되어 있다. 주제별 단어분포에서 몇개의 단어가 dominant해진다는 얘기. document의 주제도 마찬가지다. 극단적인 경우, 주제 하나가 단어 하나만 가지고, 문서 하나도 하나의 주제만 100% 가지게 될 것이다. 애초 랜덤하게 단어마다 주제를 배치하면 단어의 주제나, 문서의 주제도 거의 균일하게 퍼져 있게 되어 있어서 여기에 sparcity를 가하는(\(\alpha, \beta\)를 가해서 sampling and reassign하는) 과정에서 한 문서 안에 묶인 단어들이 되도록 같은 주제를 가지도록 단어별 주제분포가 따라서 변한다. 곧, 허락하는 한 가장 극단적으로 entropy를 낮춘다는 얘기. &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;&amp;lt;del&amp;gt;&lt;/ins&gt;(위키에 entropy항목[https://en.wikipedia.org/wiki/Dirichlet_distribution#Entropy]이 있는데 이건 또 무슨소린지 모를 소리만 몇줄 ㅋㅋ )&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;&amp;lt;/del&amp;gt; &lt;/ins&gt;따라서 document가 '실제'로 존재하는 문서들처럼 단어를 균일하게(이래야 너무 극단적인 분포를 가지는 것을 막아준다), 그리고 적당하게 불균일하게(주제에 편향된 단어분포를 가질 것이므로) 가지고 있지 않고, 어떤식으로든 조작되어 있다면 잘 동작하지 않을 것이다. 관찰되는 document의 양이 많을수록 유리한, 그러니까 실제로 써먹으려면 양질의 데이터가 어느정도 있어주어야 한다는 뜻.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Admin</name></author>
		
	</entry>
	<entry>
		<id>http://samediff.kr/wiki/index.php?title=LDA&amp;diff=12563&amp;oldid=prev</id>
		<title>2017년 7월 5일 (수) 02:11에 Admin님의 편집</title>
		<link rel="alternate" type="text/html" href="http://samediff.kr/wiki/index.php?title=LDA&amp;diff=12563&amp;oldid=prev"/>
		<updated>2017-07-05T02:11:53Z</updated>

		<summary type="html">&lt;p&gt;&lt;/p&gt;
&lt;table class=&quot;diff diff-contentalign-left&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;ko&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;← 이전 판&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;2017년 7월 5일 (수) 02:11 판&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l1&quot; &gt;1번째 줄:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;1번째 줄:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;−&lt;/td&gt;&lt;td style=&quot;color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;일단 [https://en.wikipedia.org/wiki/Latent_Dirichlet_allocation 위키].(여기보면 처음 발표된 논문은 인용이 10k가 넘는 굉장히 기념비적인 논문이라고 함.) 뭔가 엄청나게 복잡한 수식이 마구마구 등장한다. &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;무슨얘긴지 &lt;/del&gt;읽어볼 엄두도 안냈음.&amp;lt;br&amp;gt;&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;일단 [https://en.wikipedia.org/wiki/Latent_Dirichlet_allocation 위키].(여기보면 처음 발표된 논문은 인용이 10k가 넘는 굉장히 기념비적인 논문이라고 함.) &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;&amp;lt;del&amp;gt;&lt;/ins&gt;뭔가 엄청나게 복잡한 수식이 마구마구 등장한다. 읽어볼 엄두도 안냈음.&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;&amp;lt;/del&amp;gt;&lt;/ins&gt;&amp;lt;br&amp;gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;이걸 또 한글 위키([https://ko.wikipedia.org/wiki/잠재_디리클레_할당 잠재 디리클레 할당])로 모두 번역하는 수고를 누군가 했다. ㄷㄷㄷㄷㄷ  &lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;이걸 또 한글 위키([https://ko.wikipedia.org/wiki/잠재_디리클레_할당 잠재 디리클레 할당])로 모두 번역하는 수고를 누군가 했다. ㄷㄷㄷㄷㄷ  &lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Admin</name></author>
		
	</entry>
	<entry>
		<id>http://samediff.kr/wiki/index.php?title=LDA&amp;diff=12198&amp;oldid=prev</id>
		<title>2017년 6월 20일 (화) 10:00에 Admin님의 편집</title>
		<link rel="alternate" type="text/html" href="http://samediff.kr/wiki/index.php?title=LDA&amp;diff=12198&amp;oldid=prev"/>
		<updated>2017-06-20T10:00:38Z</updated>

		<summary type="html">&lt;p&gt;&lt;/p&gt;
&lt;table class=&quot;diff diff-contentalign-left&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;ko&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;← 이전 판&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;2017년 6월 20일 (화) 10:00 판&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l22&quot; &gt;22번째 줄:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;22번째 줄:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;−&lt;/td&gt;&lt;td style=&quot;color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;gibbs로 iteration을 많이 돌면 최적점에 수렴한다고 확신할 수 있는지 궁금한데, 그 증명은 못찾아보겠다. dirichlet distribution이 unimodality[https://en.wikipedia.org/wiki/Unimodality]를 보장하면 되는건가(혹은 그 반대인가) 싶다가도.. 그냥 모르겠음. 말하자면 뭔가 solution을 찾기엔 rank가 부족하다는 느낌이 있다.  &lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;gibbs로 iteration을 많이 돌면 최적점에 수렴한다고 확신할 수 있는지 궁금한데, 그 증명은 못찾아보겠다. &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;&amp;lt;del&amp;gt;&lt;/ins&gt;dirichlet distribution이 unimodality[https://en.wikipedia.org/wiki/Unimodality]를 보장하면 되는건가(혹은 그 반대인가) 싶다가도.. 그냥 모르겠음. 말하자면 뭔가 solution을 찾기엔 rank가 부족하다는 느낌이 있다. &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;&amp;lt;/del&amp;gt;&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;====지금까지 이해한 바로는,====  &lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;====지금까지 이해한 바로는,====  &lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;이 추정의 결과가 거의 항상 일치할 수 있는 이유는 단어가 document로 묶여있기 때문. hyperparameter를 모두 1보다 작게(위의 예시에서도 \(\alpha=0.1, \beta=0.001\)주었음)주면 각 단어가 가질 수 있는 주제가 'rich get richer' fashion으로 모이게 되어 있다. 주제별 단어분포에서 몇개의 단어가 dominant해진다는 얘기. document의 주제도 마찬가지다. 극단적인 경우, 주제 하나가 단어 하나만 가지고, 문서 하나도 하나의 주제만 100% 가지게 될 것이다. 애초 랜덤하게 단어마다 주제를 배치하면 단어의 주제나, 문서의 주제도 거의 균일하게 퍼져 있게 되어 있어서 여기에 sparcity를 가하는(\(\alpha, \beta\)를 가해서 sampling and reassign하는) 과정에서 한 문서 안에 묶인 단어들이 되도록 같은 주제를 가지도록 단어별 주제분포가 따라서 변한다. 곧, 허락하는 한 가장 극단적으로 entropy를 낮춘다는 얘기. (위키에 entropy항목[https://en.wikipedia.org/wiki/Dirichlet_distribution#Entropy]이 있는데 이건 또 무슨소린지 모를 소리만 몇줄 ㅋㅋ ) 따라서 document가 '실제'로 존재하는 문서들처럼 단어를 균일하게(이래야 너무 극단적인 분포를 가지는 것을 막아준다), 그리고 적당하게 불균일하게(주제에 편향된 단어분포를 가질 것이므로) 가지고 있지 않고, 어떤식으로든 조작되어 있다면 잘 동작하지 않을 것이다. 관찰되는 document의 양이 많을수록 유리한, 그러니까 실제로 써먹으려면 양질의 데이터가 어느정도 있어주어야 한다는 뜻.&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;이 추정의 결과가 거의 항상 일치할 수 있는 이유는 단어가 document로 묶여있기 때문. hyperparameter를 모두 1보다 작게(위의 예시에서도 \(\alpha=0.1, \beta=0.001\)주었음)주면 각 단어가 가질 수 있는 주제가 'rich get richer' fashion으로 모이게 되어 있다. 주제별 단어분포에서 몇개의 단어가 dominant해진다는 얘기. document의 주제도 마찬가지다. 극단적인 경우, 주제 하나가 단어 하나만 가지고, 문서 하나도 하나의 주제만 100% 가지게 될 것이다. 애초 랜덤하게 단어마다 주제를 배치하면 단어의 주제나, 문서의 주제도 거의 균일하게 퍼져 있게 되어 있어서 여기에 sparcity를 가하는(\(\alpha, \beta\)를 가해서 sampling and reassign하는) 과정에서 한 문서 안에 묶인 단어들이 되도록 같은 주제를 가지도록 단어별 주제분포가 따라서 변한다. 곧, 허락하는 한 가장 극단적으로 entropy를 낮춘다는 얘기. (위키에 entropy항목[https://en.wikipedia.org/wiki/Dirichlet_distribution#Entropy]이 있는데 이건 또 무슨소린지 모를 소리만 몇줄 ㅋㅋ ) 따라서 document가 '실제'로 존재하는 문서들처럼 단어를 균일하게(이래야 너무 극단적인 분포를 가지는 것을 막아준다), 그리고 적당하게 불균일하게(주제에 편향된 단어분포를 가질 것이므로) 가지고 있지 않고, 어떤식으로든 조작되어 있다면 잘 동작하지 않을 것이다. 관찰되는 document의 양이 많을수록 유리한, 그러니까 실제로 써먹으려면 양질의 데이터가 어느정도 있어주어야 한다는 뜻.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Admin</name></author>
		
	</entry>
	<entry>
		<id>http://samediff.kr/wiki/index.php?title=LDA&amp;diff=12122&amp;oldid=prev</id>
		<title>2017년 6월 16일 (금) 03:07에 Admin님의 편집</title>
		<link rel="alternate" type="text/html" href="http://samediff.kr/wiki/index.php?title=LDA&amp;diff=12122&amp;oldid=prev"/>
		<updated>2017-06-16T03:07:01Z</updated>

		<summary type="html">&lt;p&gt;&lt;/p&gt;
&lt;table class=&quot;diff diff-contentalign-left&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;ko&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;← 이전 판&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;2017년 6월 16일 (금) 03:07 판&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l22&quot; &gt;22번째 줄:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;22번째 줄:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;−&lt;/td&gt;&lt;td style=&quot;color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;gibbs로 iteration을 많이 돌면 최적점에 수렴한다고 확신할 수 있는지 궁금한데, 그 증명은 못찾아보겠다. dirichlet distribution이 unimodality[https://en.wikipedia.org/wiki/Unimodality]를 보장하면 되는건가(혹은 그 반대인가) 싶다가도.. 그냥 모르겠음.&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;gibbs로 iteration을 많이 돌면 최적점에 수렴한다고 확신할 수 있는지 궁금한데, 그 증명은 못찾아보겠다. dirichlet distribution이 unimodality[https://en.wikipedia.org/wiki/Unimodality]를 보장하면 되는건가(혹은 그 반대인가) 싶다가도.. 그냥 모르겠음&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;. 말하자면 뭔가 solution을 찾기엔 rank가 부족하다는 느낌이 있다. &lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot;&gt; &lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;====지금까지 이해한 바로는,==== &lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot;&gt; &lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;이 추정의 결과가 거의 항상 일치할 수 있는 이유는 단어가 document로 묶여있기 때문. hyperparameter를 모두 1보다 작게(위의 예시에서도 \(\alpha=0.1, \beta=0.001\)주었음)주면 각 단어가 가질 수 있는 주제가 'rich get richer' fashion으로 모이게 되어 있다. 주제별 단어분포에서 몇개의 단어가 dominant해진다는 얘기. document의 주제도 마찬가지다. 극단적인 경우, 주제 하나가 단어 하나만 가지고, 문서 하나도 하나의 주제만 100% 가지게 될 것이다. 애초 랜덤하게 단어마다 주제를 배치하면 단어의 주제나, 문서의 주제도 거의 균일하게 퍼져 있게 되어 있어서 여기에 sparcity를 가하는(\(\alpha, \beta\)를 가해서 sampling and reassign하는) 과정에서 한 문서 안에 묶인 단어들이 되도록 같은 주제를 가지도록 단어별 주제분포가 따라서 변한다. 곧, 허락하는 한 가장 극단적으로 entropy를 낮춘다는 얘기. (위키에 entropy항목[https://en.wikipedia.org/wiki/Dirichlet_distribution#Entropy]이 있는데 이건 또 무슨소린지 모를 소리만 몇줄 ㅋㅋ ) 따라서 document가 '실제'로 존재하는 문서들처럼 단어를 균일하게(이래야 너무 극단적인 분포를 가지는 것을 막아준다), 그리고 적당하게 불균일하게(주제에 편향된 단어분포를 가질 것이므로) 가지고 있지 않고, 어떤식으로든 조작되어 있다면 잘 동작하지 않을 것이다. 관찰되는 document의 양이 많을수록 유리한, 그러니까 실제로 써먹으려면 양질의 데이터가 어느정도 있어주어야 한다는 뜻&lt;/ins&gt;.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Admin</name></author>
		
	</entry>
	<entry>
		<id>http://samediff.kr/wiki/index.php?title=LDA&amp;diff=12119&amp;oldid=prev</id>
		<title>2017년 6월 16일 (금) 02:30에 Admin님의 편집</title>
		<link rel="alternate" type="text/html" href="http://samediff.kr/wiki/index.php?title=LDA&amp;diff=12119&amp;oldid=prev"/>
		<updated>2017-06-16T02:30:11Z</updated>

		<summary type="html">&lt;p&gt;&lt;/p&gt;
&lt;table class=&quot;diff diff-contentalign-left&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;ko&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;← 이전 판&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;2017년 6월 16일 (금) 02:30 판&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l7&quot; &gt;7번째 줄:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;7번째 줄:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;[http://bab2min.tistory.com/569 &amp;lt;nowiki&amp;gt;[1]&amp;lt;/nowiki&amp;gt;]읽을 때 미리 염두에 두면 좋을 것:  &lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;[http://bab2min.tistory.com/569 &amp;lt;nowiki&amp;gt;[1]&amp;lt;/nowiki&amp;gt;]읽을 때 미리 염두에 두면 좋을 것:  &lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;# 문서가 가지는 주제의 분포\(\theta\)와 각 주제가 가질 수 있는 단어의 분포\(\varphi\)를 모른다.  &lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;# 문서가 가지는 주제의 분포\(\theta\)와 각 주제가 가질 수 있는 단어의 분포\(\varphi\)를 모른다.  &lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;−&lt;/td&gt;&lt;td style=&quot;color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;# 단어가 어느 주제에 속해 &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;있는지를 &lt;/del&gt;(collapsed) gibbs sampling한다.&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;# 단어가 어느 주제에 속해 &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;있는지 맞추는 것이 목적 : 여기서는 &lt;/ins&gt;(collapsed) gibbs sampling한다.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;단어를 주제에 (잘) 매칭하면, \(\theta, \varphi\) 둘 다 자동으로 나온다.&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;단어를 주제에 (잘) 매칭하면, \(\theta, \varphi\) 둘 다 자동으로 나온다.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;collapsed gibbs sampling한다고 하는데, gibbs sampling과 (약간) 다른 것이다.[https://en.wikipedia.org/wiki/Gibbs_sampling]&amp;lt;br&amp;gt;&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;collapsed gibbs sampling한다고 하는데, gibbs sampling과 (약간) 다른 것이다.[https://en.wikipedia.org/wiki/Gibbs_sampling]&amp;lt;br&amp;gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;gibbs sampling은,&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;gibbs sampling은,&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;−&lt;/td&gt;&lt;td style=&quot;color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;\(x_{j}^{ {(i+1)}}\)를 \({\displaystyle p\left(x_{j}^{(i+1)}|x_{1}^{(i+1)},\dots ,x_{j-1}^{(i+1)},x_{j+1}^{(i)},\dots ,x_{n}^{(i)}\right)}\)에 따라 update하는 반면, collapsed gibbs는 아예 &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;marginalize시켜 버린다고 &lt;/del&gt;한다.&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;\(x_{j}^{ {(i+1)}}\)를 \({\displaystyle p\left(x_{j}^{(i+1)}|x_{1}^{(i+1)},\dots ,x_{j-1}^{(i+1)},x_{j+1}^{(i)},\dots ,x_{n}^{(i)}\right)}\)에 따라 update하는 반면, collapsed gibbs는 아예 &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;일부를 marginalize하고 update한다고 &lt;/ins&gt;한다.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&amp;lt;blockquote&amp;gt;imagine that a model consists of three variables A, B, and C. A simple Gibbs sampler would sample from p(A|B,C), then p(B|A,C), then p(C|A,B). A collapsed Gibbs sampler might replace the sampling step for A with a sample taken from the marginal distribution p(A|C), with variable B integrated out in this case.[https://en.wikipedia.org/wiki/Gibbs_sampling#Collapsed_Gibbs_sampler]&amp;lt;/blockquote&amp;gt;&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&amp;lt;blockquote&amp;gt;imagine that a model consists of three variables A, B, and C. A simple Gibbs sampler would sample from p(A|B,C), then p(B|A,C), then p(C|A,B). A collapsed Gibbs sampler might replace the sampling step for A with a sample taken from the marginal distribution p(A|C), with variable B integrated out in this case.[https://en.wikipedia.org/wiki/Gibbs_sampling#Collapsed_Gibbs_sampler]&amp;lt;/blockquote&amp;gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;(이게 설명만 읽으면 알겠는데 또 위에 [http://bab2min.tistory.com/569 &amp;lt;nowiki&amp;gt;[1]&amp;lt;/nowiki&amp;gt;]에서 실제로 하는것 보면 collapsed가 아닌것 같고 그렇다고 basic version하고는 또 달라서 그냥 알쏭달쏭하다. basic version이라면 LDA할 때 하나를 빼놓는 것이 아니라 나머지에 대해 조건부확률을 보아야 할 것인데 아예 그 하나를 빼버리고 나머지만으로 분포를 구성한 후 추정하기 때문에 collapsed인가 싶다가도, collapsed는 빼버린 그것을 추정하는 것이 아니고 빼버린후 (뺀건 생각하지 않고) 나머지에 대해 sampling하는거 같은데, 그럼 아니지 않나 싶기도 하고 -_-)&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;(이게 설명만 읽으면 알겠는데 또 위에 [http://bab2min.tistory.com/569 &amp;lt;nowiki&amp;gt;[1]&amp;lt;/nowiki&amp;gt;]에서 실제로 하는것 보면 collapsed가 아닌것 같고 그렇다고 basic version하고는 또 달라서 그냥 알쏭달쏭하다. basic version이라면 LDA할 때 하나를 빼놓는 것이 아니라 나머지에 대해 조건부확률을 보아야 할 것인데 아예 그 하나를 빼버리고 나머지만으로 분포를 구성한 후 추정하기 때문에 collapsed인가 싶다가도, collapsed는 빼버린 그것을 추정하는 것이 아니고 빼버린후 (뺀건 생각하지 않고) 나머지에 대해 sampling하는거 같은데, 그럼 아니지 않나 싶기도 하고 -_-)&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Admin</name></author>
		
	</entry>
	<entry>
		<id>http://samediff.kr/wiki/index.php?title=LDA&amp;diff=12118&amp;oldid=prev</id>
		<title>2017년 6월 15일 (목) 18:03에 Admin님의 편집</title>
		<link rel="alternate" type="text/html" href="http://samediff.kr/wiki/index.php?title=LDA&amp;diff=12118&amp;oldid=prev"/>
		<updated>2017-06-15T18:03:33Z</updated>

		<summary type="html">&lt;p&gt;&lt;/p&gt;
&lt;table class=&quot;diff diff-contentalign-left&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;ko&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;← 이전 판&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;2017년 6월 15일 (목) 18:03 판&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l18&quot; &gt;18번째 줄:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;18번째 줄:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;hyperparameter로 \(\alpha, \beta\)가 더해지는데, 아마도 dirichlet distribution[http://iph.kr/wiki/index.php/Dirichlet_distribution]이 prior를 추정하면  \(\operatorname {Dir} (K,\mathbf {c} +{\boldsymbol {\alpha }}) \)라서 그런듯하다. (\(\mathbf {c}\)는 occurence. 즉, 발생횟수) 확실치 않음.&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;hyperparameter로 \(\alpha, \beta\)가 더해지는데, 아마도 dirichlet distribution[http://iph.kr/wiki/index.php/Dirichlet_distribution]이 prior를 추정하면  \(\operatorname {Dir} (K,\mathbf {c} +{\boldsymbol {\alpha }}) \)라서 그런듯하다. (\(\mathbf {c}\)는 occurence. 즉, 발생횟수) 확실치 않음.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot;&gt; &lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot;&gt; &lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;[http://brooksandrew.github.io/simpleblog/articles/latent-dirichlet-allocation-under-the-hood/]에 보면 from scratch부터 구현되어 있다.&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Admin</name></author>
		
	</entry>
</feed>