RenskHTML.java [Last ned]

/*
 * Programmet mottar inndata som er en nettside, via
 * programmet NettsideLeser. Tekstlinje for tekslinje
 * blir håndtert, og alle HTML-tagger fjernes.
 *
 * OBS!
 * 1) I samme mappe må du ha NettsideLeser.java.
 * 2) Det er trykkfeil i oppgaveteksten. De to
 *  programmene i produksjonslinjen kjøres slik:
 *  java NettsideLeser www.nrk.no | java RenskHTML
 */
import static java.lang.System.*;
import java.util.*;
 
public class RenskHTML {
 
 public static void main(String[] args) {
 
  Scanner stdin = new Scanner(in);
 
  while (stdin.hasNextLine()) {
	 String linje = stdin.nextLine();
   out.println( fjernHTML(linje) );
  }
 
  stdin.close();
 }
 
 private static String fjernHTML(String txt) {
 // Hopper over tekst f.o.m. < t.o.m. >
  String ut = "";
  boolean taMedTegn = true;
  for (int i=0; i<txt.length(); i++) {
   char tegn = txt.charAt(i);
   if ( tegn == '<' )
    taMedTegn = false;
   if ( taMedTegn && tegn != '>' )
    ut += tegn;
   if ( tegn == '>' )
    taMedTegn = true;
  }
  return ut;
 }
 
}
Kildekode blir vist ved hjelp av GeSHi.