<?xml version="1.0" encoding="UTF-8"?><!-- generator="wordpress/2.0" -->
<rss version="2.0" 
	xmlns:content="http://purl.org/rss/1.0/modules/content/">
<channel>
	<title>Comments on: Кто здесь? Основы анализа серверных журналов</title>
	<link>http://www.gui.ru/ivan/log-analysis/</link>
	<description>Война миров: Как примирить их?</description>
	<pubDate>Thu, 09 Feb 2012 01:13:04 +0000</pubDate>
	<generator>http://wordpress.org/?v=2.0</generator>

	<item>
		<title>by: Иван Дегтяренко</title>
		<link>http://www.gui.ru/ivan/log-analysis/#comment-6072</link>
		<pubDate>Mon, 02 Jun 2008 07:26:32 +0000</pubDate>
		<guid>http://www.gui.ru/ivan/log-analysis/#comment-6072</guid>
					<description>Dem, спасибо за любопытные данные.</description>
		<content:encoded><![CDATA[<p>Dem, спасибо за любопытные данные.
</p>
]]></content:encoded>
				</item>
	<item>
		<title>by: Dem</title>
		<link>http://www.gui.ru/ivan/log-analysis/#comment-6061</link>
		<pubDate>Sun, 01 Jun 2008 20:59:21 +0000</pubDate>
		<guid>http://www.gui.ru/ivan/log-analysis/#comment-6061</guid>
					<description>Мои поиски привели к диссертации 

Щербина, Андрей Андреевич.
Исследование и разработка метода автоматической классификации поведения пользователей Интернет [Электронный ресурс]: дис.... канд. физ.-мат. наук: 05.13.11. - М.: РГБ, 2007. - (Из фондов Российской Государственной Библиотеки).

Автор собственно реализовал кластеризацию сессий по лог-файлу.

Вы говорите в статье
&quot;Также в лог-файл могут быть включены коды cookie-файлов, полученных посетителями. Это позволяет существенно повысить точность выделения отдельных посетителей.&quot;

К сожалению, серверов, которые имеют такую возможность немного. Кроме того ни один лог-анализатор не способен предоставить данных об операционной системе и экранных настройках пользователя, об использовании им определенных браузеров и версий Java Script. А пока счетчики  так и будут основным инструментом статистики.

Правда, компания NetPromoter предложила довольно интересное решение http://cybermarketing.ru/kniga-avtory-izdatelstvo/statistics_12.htm</description>
		<content:encoded><![CDATA[<p>Мои поиски привели к диссертации </p>
<p>Щербина, Андрей Андреевич.<br />
Исследование и разработка метода автоматической классификации поведения пользователей Интернет [Электронный ресурс]: дис&#8230;. канд. физ.-мат. наук: 05.13.11. - М.: РГБ, 2007. - (Из фондов Российской Государственной Библиотеки).</p>
<p>Автор собственно реализовал кластеризацию сессий по лог-файлу.</p>
<p>Вы говорите в статье<br />
&#8220;Также в лог-файл могут быть включены коды cookie-файлов, полученных посетителями. Это позволяет существенно повысить точность выделения отдельных посетителей.&#8221;</p>
<p>К сожалению, серверов, которые имеют такую возможность немного. Кроме того ни один лог-анализатор не способен предоставить данных об операционной системе и экранных настройках пользователя, об использовании им определенных браузеров и версий Java Script. А пока счетчики  так и будут основным инструментом статистики.</p>
<p>Правда, компания NetPromoter предложила довольно интересное решение <a href='http://cybermarketing.ru/kniga-avtory-izdatelstvo/statistics_12.htm' rel='nofollow'>http://cybermarketing.ru/kniga-avtory-izdatelstvo/statistics_12.htm</a>
</p>
]]></content:encoded>
				</item>
	<item>
		<title>by: Иван Дегтяренко</title>
		<link>http://www.gui.ru/ivan/log-analysis/#comment-4774</link>
		<pubDate>Wed, 27 Feb 2008 22:25:04 +0000</pubDate>
		<guid>http://www.gui.ru/ivan/log-analysis/#comment-4774</guid>
					<description>Что ж, могу пожелать удачи ;)</description>
		<content:encoded><![CDATA[<p>Что ж, могу пожелать удачи <img src='http://www.gui.ru/ivan/wp-includes/images/smilies/icon_wink.gif' alt=';)' class='wp-smiley' />
</p>
]]></content:encoded>
				</item>
	<item>
		<title>by: Dem</title>
		<link>http://www.gui.ru/ivan/log-analysis/#comment-4773</link>
		<pubDate>Wed, 27 Feb 2008 22:04:32 +0000</pubDate>
		<guid>http://www.gui.ru/ivan/log-analysis/#comment-4773</guid>
					<description>Я хочу написать систему, которая позволит рекламодателю оценить  по текстам запросов аудиторию сайта. Понятно, что кроме текстов в анализе будут участвовать региональная привязка, частота запроса, время пребывания пользователя на сайте, пришедшего по данному, конкретному запросу и возможно ряд других параметров. Это будет дипломная работа. 

Ваша статья, Иван меня очень заинтересовала, так что буду рад вашим советам и замечаниям.</description>
		<content:encoded><![CDATA[<p>Я хочу написать систему, которая позволит рекламодателю оценить  по текстам запросов аудиторию сайта. Понятно, что кроме текстов в анализе будут участвовать региональная привязка, частота запроса, время пребывания пользователя на сайте, пришедшего по данному, конкретному запросу и возможно ряд других параметров. Это будет дипломная работа. </p>
<p>Ваша статья, Иван меня очень заинтересовала, так что буду рад вашим советам и замечаниям.
</p>
]]></content:encoded>
				</item>
	<item>
		<title>by: Иван Дегтяренко</title>
		<link>http://www.gui.ru/ivan/log-analysis/#comment-4738</link>
		<pubDate>Thu, 21 Feb 2008 19:51:46 +0000</pubDate>
		<guid>http://www.gui.ru/ivan/log-analysis/#comment-4738</guid>
					<description>Спасибо за интерес!
Думаю, совместить технологии кластерного анализа и контент-анализа в принципе возможно, хотя конкретные примеры исследований мне неизвестны. Для этого при помощи контент-анализа нужно выделить определенные количественные или классифицирующие характеристики текста. Об этом можно почитать в любом руководстве по контент-анализу. Затем эти характеристики мы используем в кластер анализе, здесь скорее всего подойдет two step claster analysis (подобная фича есть в SPSS). 
Другое дело, что из поисковых запросов не очень много показателей можно вытянуть. По крайней мере, только этих показателей будет явно недостаточно. Можно получить длину запроса, количество запросов в сессии. Если это узкотематический ресурс, то теоретически возможно составить глоссарий для автоматической тематической классификации запросов. Что-то еще сходу не придумаю.</description>
		<content:encoded><![CDATA[<p>Спасибо за интерес!<br />
Думаю, совместить технологии кластерного анализа и контент-анализа в принципе возможно, хотя конкретные примеры исследований мне неизвестны. Для этого при помощи контент-анализа нужно выделить определенные количественные или классифицирующие характеристики текста. Об этом можно почитать в любом руководстве по контент-анализу. Затем эти характеристики мы используем в кластер анализе, здесь скорее всего подойдет two step claster analysis (подобная фича есть в SPSS).<br />
Другое дело, что из поисковых запросов не очень много показателей можно вытянуть. По крайней мере, только этих показателей будет явно недостаточно. Можно получить длину запроса, количество запросов в сессии. Если это узкотематический ресурс, то теоретически возможно составить глоссарий для автоматической тематической классификации запросов. Что-то еще сходу не придумаю.
</p>
]]></content:encoded>
				</item>
	<item>
		<title>by: Dem</title>
		<link>http://www.gui.ru/ivan/log-analysis/#comment-4732</link>
		<pubDate>Wed, 20 Feb 2008 20:37:37 +0000</pubDate>
		<guid>http://www.gui.ru/ivan/log-analysis/#comment-4732</guid>
					<description>Очень познавательная статья. У меня вопрос к автору: Есть ли в природе технологии кластеризации сессий на основе анализа текстов запросов - и что можно почитать.</description>
		<content:encoded><![CDATA[<p>Очень познавательная статья. У меня вопрос к автору: Есть ли в природе технологии кластеризации сессий на основе анализа текстов запросов - и что можно почитать.
</p>
]]></content:encoded>
				</item>
</channel>
</rss>

