<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>PHP Gangsta - Der PHP Blog &#187; apache</title>
	<atom:link href="http://www.phpgangsta.de/tag/apache/feed" rel="self" type="application/rss+xml" />
	<link>http://www.phpgangsta.de</link>
	<description>Ein PHP Blog mit Themen aller Art. Manchmal vergewaltige ich PHP...</description>
	<lastBuildDate>Tue, 10 Aug 2010 10:47:09 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0</generator>
		<item>
		<title>Client-IP Problem bei Reverse-Proxy-Betrieb</title>
		<link>http://www.phpgangsta.de/client-ip-problem-bei-reverse-proxy-betrieb</link>
		<comments>http://www.phpgangsta.de/client-ip-problem-bei-reverse-proxy-betrieb#comments</comments>
		<pubDate>Wed, 07 Oct 2009 06:35:25 +0000</pubDate>
		<dc:creator>Michael Kliewe</dc:creator>
				<category><![CDATA[PHP]]></category>
		<category><![CDATA[Access Log]]></category>
		<category><![CDATA[apache]]></category>
		<category><![CDATA[Client IP]]></category>
		<category><![CDATA[mod_rpaf]]></category>
		<category><![CDATA[nginx]]></category>
		<category><![CDATA[REMOTE_ADDR]]></category>
		<category><![CDATA[Reverse Proxy]]></category>
		<category><![CDATA[X_Forwarded_For]]></category>

		<guid isPermaLink="false">http://www.phpgangsta.de/?p=453</guid>
		<description><![CDATA[In einem meiner letzten Artikel schrieb ich ja bereits  [...]]]></description>
			<content:encoded><![CDATA[<p>In einem meiner <a href="http://www.phpgangsta.de/451" target="_blank">letzten Artikel schrieb ich ja bereits über Reverse-Proxies</a>. Der Reverse-Proxy nimmt die Verbindung vom Client (Browser) entgegen, dann kann er entweder selbst den Request bedienen (statische Dateien von der lokalen Platte oder aus dem Cache), oder er verbindet sich zu einem der Backend-Webserver, ruft dort die geforderte Datei ab, und sendet sie dem Client zurück.</p>
<p>Ein Problem entsteht nun auf dem Backend-Webserver: Alle Requests kommen vom Reverse-Proxy. Wenn nun in den PHP-Scripten die Client-IP-Adresse verwendet wird, steht darin die IP des Reverse-Proxies.</p>
<p>Betroffen ist in diesem Fall die PHP-Variable  $_SERVER['REMOTE_ADDR']  als auch das Apache-Log, denn dort taucht auch immer nur die IP des Reverse-Proxy auf.</p>
<p><img class="alignnone size-full wp-image-467" title="xforwardedfor3" src="http://www.phpgangsta.de/wp-content/uploads/xforwardedfor3.jpg" alt="xforwardedfor3" width="611" height="75" /></p>
<pre class="brush: plain;">127.0.0.1 - - [03/Oct/2009:10:45:24 +0200] &quot;GET /phpinfo.php HTTP/1.0&quot; 200 7800 &quot;-&quot; &quot;Mozilla/5.0 (Windows; U; Windows NT 6.0; de; rv:1.9.1.3) Gecko/20090824 Firefox/3.5.3 (.NET CLR 3.5.30729) FirePHP/0.3&quot;</pre>
<p>127.0.0.1 deshalb, da ich direkt auf der Linux-Maschine sowohl den nginx als auch den Apache laufen habe.</p>
<p>Da gibt es natürlich Lösungen. Zuerst einmal müssen wir die Client-IP irgendwie an den Backend-Webserver übergeben. Dafür gibt es den Header &#8220;X_FORWARDED_FOR&#8221;, da wird der nginx die Client-IP reinschreiben.</p>
<p>Im nginx muss dann folgendes gesetzt werden:</p>
<pre class="brush: plain;">location / {
proxy_set_header Host $http_host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
proxy_redirect off;
........</pre>
<p>Ein phpinfo() liefert dann die korrekte Client-IP in X_FORWARDED_FOR (34 ist der Server, 33 der Client):</p>
<pre><img class="alignnone size-full wp-image-469" title="xforwardedfor4" src="http://www.phpgangsta.de/wp-content/uploads/xforwardedfor4.jpg" alt="xforwardedfor4" width="612" height="106" /></pre>
<p>Nun installieren wir noch ein Apache-Modul. Dieses Modul sorgt dafür, dass in die Variable $_SERVER['REMOTE_ADDR']  der Wert aus X-FORWARDED-FOR geschreiben wird, damit wir keine PHP-Scripte anpassen müssen. Außerdem sorgt dieses Modul dafür, dass im Apache-Log dieser Wert auftaucht.</p>
<p>Das Module, das es für diese Aufgabe gibt, lautet &#8220;mod_rpaf&#8221;. Einfach danach googlen, downloaden und in der Apache-Konfiguration laden. Oder unter Linux:</p>
<pre class="brush: bash;">sudo apt-get install libapache2-mod-rpaf</pre>
<p>Noch kurz konfigurieren /etc/apache2/mods-available/rpaf.conf:</p>
<pre class="brush: plain;">&lt;IfModule mod_rpaf.c&gt;
RPAFenable On
RPAFsethostname On
RPAFproxy_ips 127.0.0.1
&lt;/IfModule&gt;</pre>
<p>Das Ergebnis sieht dann so aus:</p>
<p><img class="alignnone size-full wp-image-468" title="xforwardedfor2" src="http://www.phpgangsta.de/wp-content/uploads/xforwardedfor21.jpg" alt="xforwardedfor2" width="611" height="120" /></p>
<pre class="brush: plain;">192.168.1.33 - - [03/Oct/2009:10:47:23 +0200] &quot;GET /phpinfo.php HTTP/1.0&quot; 200 7808 &quot;-&quot; &quot;Mozilla/5.0 (Windows; U; Windows NT 6.0; de; rv:1.9.1.3) Gecko/20090824 Firefox/3.5.3 (.NET CLR 3.5.30729) FirePHP/0.3&quot;</pre>
<p>Möchte man das Modul nicht installieren, muß man überall in seinen PHP-Scripten die Variable $_SERVER['X_FORWARDED_FOR'] statt $_SERVER['REMOTE_ADDR'] nutzen, und das Apache-Log anpassen:</p>
<pre class="brush: plain;">LogFormat &quot;%{X-Forwarded-For}i %l %u %t \&quot;%r\&quot; %&gt;s %b \&quot;%{Referer}i\&quot; \&quot;%{User-Agent}i\&quot;&quot; combined</pre>
<p>Damit hätten wir das Problem auch gelöst, überall steht nun die Client-IP zur Verfügung, die Anwendungen und Logs laufen wieder korrekt.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.phpgangsta.de/client-ip-problem-bei-reverse-proxy-betrieb/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Traffic pro eingeloggtem User herausfinden</title>
		<link>http://www.phpgangsta.de/traffic-pro-eingeloggtem-user-herausfinden</link>
		<comments>http://www.phpgangsta.de/traffic-pro-eingeloggtem-user-herausfinden#comments</comments>
		<pubDate>Tue, 01 Sep 2009 18:29:40 +0000</pubDate>
		<dc:creator>Michael Kliewe</dc:creator>
				<category><![CDATA[PHP]]></category>
		<category><![CDATA[access_log]]></category>
		<category><![CDATA[apache]]></category>
		<category><![CDATA[datenbank]]></category>
		<category><![CDATA[log]]></category>
		<category><![CDATA[mysql]]></category>
		<category><![CDATA[webserver]]></category>

		<guid isPermaLink="false">http://www.phpgangsta.de/?p=359</guid>
		<description><![CDATA[Den Traffic einer ganzen Seite herauszufinden ist nicht [...]]]></description>
			<content:encoded><![CDATA[<p>Den Traffic einer ganzen Seite herauszufinden ist nicht sonderlich schwer in Zeiten von awstats, webalizer und diversen anderen Apache-Log-Analyzern.</p>
<p>Doch ich wollte damals bei meinem eigenen Browsergame den Traffic pro eingeloggtem User messen. Idee war damals, den &#8220;Free Accounts&#8221; 100MB pro Monat zu schenken, falls mehr benötigt wird, muss ein Premium-Account her.</p>
<p>Doch wie stellt man das an? Das Apache-Log hilft nicht wirklich, denn dort kann man nicht die einzelnen (eingeloggten) User unterscheiden. Ich habe damals 3 Lösungen gefunden:</p>
<ul>
<li>mit dem Output Buffer von PHP arbeiten, Stringlänge bestimmen und mitloggen, dann Seite an den Browser schicken</li>
<li>Irgendwie die IP-Adressen des Users merken, und dann das Apache-Log durchparsen und rechnen.</li>
<li>die Apache-Extension mod_log_sql</li>
</ul>
<p>Möglichkeit 1 sieht dann ungefähr so aus:</p>
<pre class="brush: php;">&lt;?php
ob_start();

// some html content here

$trafficbytes = strlen(ob_get_flush());
// insert traffic into database

?&gt;</pre>
<p>Habe es nie ausführlich getestet, aber ich denke es ist langsam (da das HTML erst am Ende geflushed wird anstatt zwischendurch schon Häppchen zu verschicken). Außerdem muß man sich noch um Bilder kümmern, denn die sollen ja auch mitgezählt werden. Dazu würde ich eine <a href="http://de.wikipedia.org/wiki/Rewrite-Engine" target="_blank">Rewrite-Rule</a> empfehlen, die bei jedem Bildrequest noch schnell ein php-Script ausführt. Auch das beeinflusst natürlich die Performance des Besuchers und des Webservers.</p>
<p>Die zweite Möglichkeit ist nicht ganz einfach umzusetzen. Die IP-Adresse allein ist nicht sonderlich aussagekräftig, einen Benutzer damit zu verfolgen recht aufwändig. In Zeiten von Proxies (Grüße an AOL), Neueinwahl bei DSL, mehrere Benutzer hinter einem Heimrouter etc reicht das nicht aus, um darüber den Benutzer zu bestimmen, gerade wenn Bruder und Schwester gemeinsam über eine Leitung im Internet sind usw.</p>
<p>Die dritte Alternative ist das Apache-Modul, welches ich dann auch genutzt habe: <a href="http://www.outoforder.cc/projects/apache/mod_log_sql/" target="_blank">mod_log_sql</a>. Dieses bindet man einfach in die entsprechene Apache-Config ein, und schon wird ein zusätzliches Log erzeugt, nämlich in der Datenbank. Dies kann man entweder für alle Seiten tun, oder nur für bestimmte VirtualHosts. Welche Spalten dort gefüllt werden sollen, in welcher Reihenfolge und mit welchen Daten, konfiguriert man in der apache-Config. Hier eine Beispielkonfiguration (hier für Linux, für Windows sieht es ähnlich aus: .dll statt .so usw.):</p>
<pre class="brush: plain;">LoadModule log_sql_module modules/mod_log_sql.so
LoadModule log_sql_mysql_module modules/mod_log_sql_mysql.so

LogSQLLoginInfo mysqli://apacheloguser:apachelogpwd@localhost/apachelogdb
LogSQLCreateTables On
LogSQLMachineID mylocalmaschine
LogSQLTransferLogFormat AbHIhMmpRSstTUuvz
LogSQLTransferLogTable ztraffic_access_log
#LogSQLNotesLogTable ztraffic_notes
LogSQLCookieLogTable ztraffic_cookies
#LogSQLHeadersInLogTable ztraffic_headers_in
#LogSQLHeadersOutLogTable ztraffic_headers_out
LogSQLWhichCookies UserID     # hier könnten noch mehr Cookies stehen</pre>
<p>Man kann alternativ zur eigenen Cookie-Tabelle auch ein bestimmtes Cookie mit &#8216;c&#8217; und &#8220;LogSQLWhichCookie&#8221; in die access_log schrieben lassen. Hier eine <a href="http://www.outoforder.cc/projects/apache/mod_log_sql/docs-2.0/?chapter=/3/6/3/" target="_blank">Liste der Informationen, die man speichern kann</a>.</p>
<p>Damit das Modul funktioniert, muß man noch das Modul &#8220;unique&#8221; aktivieren, entweder per</p>
<pre class="brush: plain;">a2enmod unique_id</pre>
<p>oder via Einkommentieren von</p>
<pre class="brush: plain;">LoadModule unique_id_module modules/mod_unique_id.so</pre>
<p>Apache reload. Wenn man danach eine Seite besucht, liest man folgendes im apache error log:</p>
<pre class="brush: plain;">[Tue Sep 01 19:59:46 2009] [notice] mod_log_sql: child established database connection
[Tue Sep 01 19:59:46 2009] [error] mysql_query returned (1)
[Tue Sep 01 19:59:46 2009] [error] table does not exist, preserving query
[Tue Sep 01 19:59:46 2009] [error] table doesn't exist...creating now
[Tue Sep 01 19:59:47 2009] [error] tables successfully created - retrying query
[Tue Sep 01 19:59:47 2009] [notice] query successful after table creation</pre>
<p>Die Tabelle wurde also erfolgreich angelegt. Das Ergebnis sieht dann so aus:</p>
<p><img class="alignnone size-full wp-image-385" title="modlogsql0" src="http://www.phpgangsta.de/wp-content/uploads/modlogsql0.jpg" alt="modlogsql0" width="819" height="647" /></p>
<p>Der Inhalt der Tabelle (nur 1 Zeile):</p>
<p><img class="alignnone size-full wp-image-384" title="modlogsql" src="http://www.phpgangsta.de/wp-content/uploads/modlogsql.jpg" alt="modlogsql" width="917" height="593" /></p>
<p>Wäre dieser Test-Request kein 304er (Not Modified), hätten wir bei &#8220;bytes_sent&#8221; auch eine Traffic-Angabe.</p>
<p>Mit Hilfe der Cookie-Tabelle können wir dann zB einmal täglich den Traffic jeden Users berechnen und in die entsprechende User-Tabelle füllen. Die Log-Tabelle sollte man dann wieder aufräumen und nicht länger benötigte Zeilen löschen.</p>
<p>Übrigens ist das Modul nur für Linux supported. Unter Windows kann man es zwar auch kompilieren, das ist aber mehr hohem Aufwand verbunden. Ich habe damals (2004) durch Zufall eine kompilierte Version gefunden. Die ist aber heute nicht mehr brauchbar, da sie für eine sehr alte Apache-Version kompiliert wurde.</p>
<p>Wenn ihr Fragen habt, fragt! Oder wenn ihr evtl. bessere Lösungen kenn, her damit! Oder was könnte man noch alles anstellen mit diesen Apache-Logs in einer Datenbank?</p>
<p>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;-</p>
<p>Weitere interessante Links zum Thema:</p>
<p><a href="http://www.howtoforge.com/apache2-logging-to-a-mysql-database-with-mod_log_sql-on-debian-etch" target="_blank">Anleitung für Debian Etch</a></p>
<p><a href="http://www.outoforder.cc/projects/apache/mod_log_sql/" target="_blank">Die offizielle Webseite des Moduls</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.phpgangsta.de/traffic-pro-eingeloggtem-user-herausfinden/feed</wfw:commentRss>
		<slash:comments>7</slash:comments>
		</item>
	</channel>
</rss>
