RenskHTML.java [Last ned]

/*
 * Programmet mottar inndata som er en nettside, via
 * programmet NettsideLeser. Tekstlinje for tekslinje
 * blir håndtert, og alle HTML-tagger fjernes.
 *
 * OBS!
 * 1) I samme mappe må du ha NettsideLeser.java.
 * 2) Det er trykkfeil i oppgaveteksten. De to
 *    programmene i produksjonslinjen kjøres slik:
 *    java NettsideLeser www.nrk.no | java RenskHTML
 */
import static java.lang.System.*;
import java.util.*;
 
public class RenskHTML {
 
  public static void main(String[] args) {
 
    Scanner stdin = new Scanner(in);
 
    while (stdin.hasNextLine()) {
	  String linje = stdin.nextLine();
      out.println( fjernHTML(linje) );
    }
 
    stdin.close();
  }
 
  private static String fjernHTML(String txt) {
  // Hopper over tekst f.o.m.  <  t.o.m.  >
    String ut = "";
    boolean taMedTegn = true;
    for (int i=0; i<txt.length(); i++) {
      char tegn = txt.charAt(i);
      if ( tegn == '<' )
        taMedTegn = false;
      if ( taMedTegn && tegn != '>' )
        ut += tegn;
      if ( tegn == '>' )
        taMedTegn = true;
    }
    return ut;
  }
 
}
Kildekode blir vist ved hjelp av GeSHi.