Samstag, 10. Januar 2015

Ubuntu 14.10 freezing frequently - Stuck on render ring


Recently I built a new PC based on a proposal in the CT journal 1/15.

The proposal contains well designed hardware components. I slightly modified  it, running it with a 256 GB SSD and 8 GB Ram. I use the built-in graphic of the celeron CPU.

Although it's just a 34 eur celeron dual core it's fast, silent and I am quite happy with it.

BUT: Recently I noticed, that there are frequent hangs. The desktop was freezing frequently (no mouse move, no keyboard input) for 2-5 seconds. This happened especially when working with firefox, scrolling or having google mail open.

Dmesg showed the following:


Jan 10 11:28:17 speedy kernel: [ 531.220050] [drm] stuck on render ring
Jan 10 11:28:17 speedy kernel: [ 531.220824] [drm] GPU HANG: ecode 0:0x87d3bffa, in Xorg [1178], reason: Ring hung, action: reset
Jan 10 11:28:17 speedy kernel: [ 531.220825] [drm] GPU hangs can indicate a bug anywhere in the entire gfx stack, including userspace.
Jan 10 11:28:17 speedy kernel: [ 531.220826] [drm] Please file a _new_ bug report on bugs.freedesktop.org against DRI -> DRM/Intel
Jan 10 11:28:17 speedy kernel: [ 531.220826] [drm] drm/i915 developers can then reassign to the right component if it's not a kernel issue.
Jan 10 11:28:17 speedy kernel: [ 531.220827] [drm] The gpu crash dump is required to analyze gpu hangs, so please always attach it.
Jan 10 11:28:17 speedy kernel: [ 531.220828] [drm] GPU crash dump saved to /sys/class/drm/card0/error
Jan 10 11:28:19 speedy kernel: [ 533.221743] [drm] Enabling RC6 states: RC6 on, RC6p off, RC6pp off

Seems like something related to the intel 915 graphics driver crashed and was restarted...

[Funny side remark: the crash dump had a size of 0, but anyway I could open and read it... Copy it to another location and finally you have a size > 0. ]

So I started digging the internet, with the result that there are plenty of similar bug reports. This ubuntu bug report seemed to be a good point to start. It was closed (obviously a similar issue was fixed already in 14.04, june 2014) but re-opened. No big activity in it, but it lead me to  https://bugs.freedesktop.org/show_bug.cgi?id=83677. It has a lot of duplicates, and the description matched my problem.

After some more time I figured out that - thanks to those guys - a kernel fix was submitted - brand new, on 16-Dec-14 (today it's the 10-Jan-15).

As I have now clue about applying a kernel patch (and the dropbox links there were already dead anyway), I searched kernel.org's git commit messages.

It turned out, that this fix found its way to the official kernel sources. Not included in the latest stable yet (3.18.2 as of today) but in the version 3.19 RC 3:


As I was not willing to wait 2 or 3 months until this will get a stable release, I decided to give it a try and to install the 3.19 RC3 kernel.

This was easier than expected. Just follow this howto. Now I'm running: 

user@system:~$ uname -r
3.19.0-031900rc3-generic


So far: No freezes any more. The message is gone. Thanks to Chris Wilson and all the supporters who provided this fix.




Mittwoch, 5. Juni 2013

Ubuntu WLAN ipw2200 auf hp nc6220

Hatte grade das Problem, dass ums verrecken mein WLAN nicht funktionieren wollte.

dmesg |grep ipw brachte folgendes:

[  755.227381] ipw2200: Intel(R) PRO/Wireless 2200/2915 Network Driver, 1.2.2kmprq
[  755.227388] ipw2200: Copyright(c) 2003-2006 Intel Corporation
[  755.227583] ipw2200 0000:02:04.0: PCI INT A -> GSI 21 (level, low) -> IRQ 21
[  755.227622] ipw2200: Detected Intel PRO/Wireless 2200BG Network Connection
[  755.375649] ipw2200: Radio Frequency Kill Switch is On:
[  755.379099] ipw2200: Detected geography ZZR (14 802.11bg channels, 0 802.11a channels)
[  821.276111] ipw2200: Failed to send TX_POWER: Command timed out.
[  829.508096] ipw2200: Failed to send POWER_MODE: Command timed out.
[  859.412101] ipw2200: Failed to send TX_POWER: Command timed out.
[  865.580104] ipw2200: Failed to send TX_POWER: Command timed out.
[  876.776115] ipw2200: Failed to send TX_POWER: Command timed out.

die entscheidene Zeile in meinem Fall ist die rote.

Das bedeutet dass entweder ein Hard oder Softswitch gerade die Karte deaktiviert. Hardswitch auf meinem Laptop war aber an (leuchtet blau).

Lösung: Das nette programm rfkill hilft hier:

sudo rfkill list
0: hp-wifi: Wireless LAN
    Soft blocked: yes
    Hard blocked: no
2: hp-bluetooth: Bluetooth
    Soft blocked: no
    Hard blocked: no
8: phy1: Wireless LAN
    Soft blocked: yes
    Hard blocked: yes
10: hci0: Bluetooth
    Soft blocked: no
    Hard blocked: no

Mittels

"sudo rfkill unblock 0" konnte ich sie wieder zum Leben erwecken. Danach standen sofort ALLE (hard + softblocked) auf "no".

 Ich frage mich nur welche Aktion die Karte deaktiviert hat...





Mittwoch, 5. September 2012

Kommentieren...

Über Kommentierung von SourceCode kann man ja trefflich streiten. Ich persönlich bin der Meinung dass es sinnvolle Kommentare gibt (da weiche ich schon zu den Hardlinern ab, die der Meinung sind Code ist Code ist Selbsterklärend). Kommentare sollten dann platziert werden, wenn beim Implementieren etwas Hirnschmalz gefordert war - oder wenn die Gefahr hoch ist, dass man es in ein einem halben Jahr vergessen hat um was es im einzelnen ging. 

Beispiel: Annahmen oder Voraussetzungen: ein Algorithmus der voraussetzt, dass eine Liste aus einem DB ResultSet bereits sortiert und gefiltert vorliegt - was ggf durch ein DB Statement schon passiert, ist durchaus einen Kommentar wert. 

Getter und Setter *seufz* müssen nicht kommentiert werden.

Hier mal ein Real World Beispiele

// write HistorieLauf
writeHistorieLauf();

oder
// init Batchlauf record
initBatchlauf();

oder


commit(); // commit work



Sind jetzt nicht gerade Kommentare die das Verständnis fördern.


Mein persönlicher Favorit:

// Hallo Co-Entwickler! Dieser
// Code mag umständlich sein,
// dient aber mir zum fachlichen
// Verständnis! Bitte so
// lassen...

Montag, 18. Juni 2012


OMG, ich habe grade einen Alptraum aus dem mich keiner weckt:


  
Bei einer Software eines großen magenta Telekommunikationsanbieter, die bei einem großen Stuttgarter Automobilkonzern im 21 Jahrhundert produktiv eingesetzt wird, habe ich ein Musterbeispiel für schlechtes DB Design gesehen. (Sollte ein Student sowas in irgendeiner DB Klausur abgeben, wird er sofort exmatrikuliert mit Empfehlung für die Baumschule).

  
Es geht um Dokumente die mehrsprachig in einer DB abgelegt werden: Titel, Name, Dateigröße, Abschnitt (=logische Gruppierung), Abschnittname etc.
  • Dokumente haben pro Sprache eine Bezeichnung und einen Dateinamen.
  • Dokumente haben eine Größe
  • Dokumente haben ein Erstellungsdatum
  • Dokumente können gelöscht sein, aber müssen in der DB bleiben
  • Es gibt verschiednene Abschnitte (aka Module)
  • Dokumente werden Abschnitten zugeordnet
  • Module haben pro Sprache genau eine Bezeichnung.

Das "Design" verstößt schon gegen die 1NF (!!!) und sieht so aus: Es wird alles in eine Tabelle geklatscht.

ID,  INTEGER
LANGUAGE,  CHAR
MODULID, INTEGER
DOC_BEZEICHNUNG, VARCHAR
DOC_FILENAME, VARCHAR
DOC_TYPE, CHAR
DOC_DATE, DATE
DOC_SIZE, CHAR
MODUL_BEZEICHNUNG, VARCHAR
GELOESCHT, CHAR
DATA, BLOB
Leute das macht jeder Schüler besser!!

Der absolute Schenkelklopfer, ist die DOC_SIZE - schaut euch mal den Datentyp an - muahaha - als CHAR. Und es kommt noch besser, der Inhalt sieht z.B. so aus "884 kB", die haben tatsächlich auch noch die Einheit mit in der gleichen Zelle abgelegt *popcornhol*. 1NF verletzt, dass muss man erstmal hinkriegen.

Ach ja 2NF ist natürlich auch gleich verletzt, Schlüssel der Tabelle ist nämlich ID + Sprache. Modulname + Bezeichnung werden redundant gehalten *gnihihii*.
 
Bin mal weg, Kotztüten sins alle...

Sonntag, 15. April 2012

Jmockit und Jacoco

Ich habe mir neulich mal JMockit genauer angeschaut. Jmockit erleichtert es SEHR Mockobjekte zu schreiben um die Interaktion zwischen Objekten zu testen.

Vorteile: Strikte Trennung von Code under Test vom Testcode und eine wahnsinns Flexibilität. Man muss die zu testenden Klassen nicht anpassen und schafft keinerlei Abhängigkeit! JMockit leitet die Calls auf getestete Klassen mittels Bytecodeinstrumentation um, und mockt diese. Man kann relativ elegant beliebige Klassen (auch nur teilweise) mocken und deren Rückgabewerte definieren.

Jetzt hatten wir hier ein Problem, weil Jacoco eingesetzt wird um die Test-Coverage zu ermitteln - also zwei Programme die den Bytecode instrumentieren. Mein Bugreport (zuerst bei Jmockit eingekippt) wurde mittlerweile sogar von Eclemma/Jacoco behoben.

Donnerstag, 25. August 2011

Welche Firma denkt sich da hier aus?

cast(null as varchar(256))

Richtig. InkompetenteBlödMänner. Bei DB2 muss alles streng typisiert sein, auch NULL. Und nein, es reicht nicht den null nur nach varchar zu casten (z.b. wenn man mit union arbeitet), man muss auch noch die gleiche LÄNGE des Datentyps angeben!!!

Freitag, 24. Juni 2011

Office Jet 6110 Scannerglas putzen

Seit kurzem hat unser OfficeJet 6110 das Problem, dass der Scanner beim anschalten rattert, als ob die Plastikzahnräder durchdrehen weil der Schlitten gegen das (Drucker)Ende fährt und durchdreht. Hat schleichend angefangen und wurde immer schlimmer, zuletzt war er nicht mehr bedienbar.

Das Problem ist simpel: Unter dem Druckerglas (nicht sichtbar von oben) ist ein Codestreifen, angebracht der dem Scanner sagt, wo das Ende ist. Ist dieser verschmutzt (es reicht wenig!) dann findet der Scannerschlitten das Ende nicht mehr.

Im Netz gibt es haufenweise Anleitungen dazu, wie man die Scaneinheit abmontiert. Allerdings ohne Bild und oft machen zwei Plastiknasen Probleme.

Ich hab mal ein paar Fotos geschossen, damit sollte es machbar sein.
  • Alle Torx Schrauben auf der Obserseite lösen
  • Kleines Scannerglas und Rahmen entfernen
  • Bedienfeld entfernen (von unten vorsichtig die Abdeckung abziehen)
  • Das darunterliegenede Panel durch lösen der Arretierung nach links schieben und nach oben abnehmen:



  • Das Panel vom Plastikband trennen (einfach abziehen)



  • Nun kann man die Scaneinheit von hinten (mitsamt Deckel) anheben, vorne blockieren allerdings noch zwei Plastiknasen. Diese zum lösen (rot markiert) nach vorne ziehen:





  • Glasunterseite mit Fensterreiniger putzen, es war kaum sichtbarer Schmutz vorhanden, aber offensichtlich hat es gereicht um den Scanner zu beinträchtigen. Der Codestreifen ist das schwarzweiße Ding.



  • Zusammenbauen in umgekehrter Reihenfolge :)