]> git.lizzy.rs Git - plan9front.git/blob - sys/man/1/uhtml
ssh(1): initial documentation, needs examples for authentication
[plan9front.git] / sys / man / 1 / uhtml
1 .TH UHTML 1
2 .SH NAME
3 uhtml \- convert foreign character set HTML file to unicode
4 .SH SYNOPSIS
5 .B uhtml
6 [
7 .B -p
8 ] [
9 .B -c
10 .I charset
11 ] [
12 .I file
13 ]
14 .SH DESCRIPTION
15 HTML comes in various character set encodings
16 and has special forms to encode characters. To
17 make it easier to process html, uhtml is used
18 to normalize it to a unicode only form.
19 .LP
20 Uhtml detects the character set of the html input
21 .I file
22 and calls
23 .IR tcs (1)
24 to convert it to utf replacing html-entity forms
25 by ther unicode character representations except for 
26 .B lt
27 .B gt
28 .B amp
29 .B quot
30 and
31 .B apos .
32 The converted html is written to
33 standard output. If no
34 .I file
35 was given, it is read from standard input. If the
36 .B -p
37 option is given, the detected character set is printed and
38 the program exits without conversion.
39 In case character set detection fails, the default (utf)
40 is assumed. This default can be changed with the
41 .B -c
42 option.
43 .SH SOURCE
44 .B /sys/src/cmd/uhtml.c
45 .SH SEE ALSO
46 .IR tcs (1)