Les caractères sont représentés par les valeurs du type char, codé sur deux octets. La plupart des alphabets des langues occidentales peuvent être représentés dans un jeu de caractères codés sur un octet, mais un même jeu de caractères ne peut évidemment coder tous les alphabets existants ; dans un souci d'internationalisation, rendu nécessaire à cause de l'Internet, Java utilise deux octets pour coder les caractères : c'est le codage Unicode, qui autorise caractères.
Les constantes de type caractère sont notées entre deux apostrophes (en
anglais single quote) : 'A', 'Z', 'a',
';', '4', etc. S'y ajoutent des caractères spéciaux
comme '\n'
pour le retour à la ligne et '\t'
pour
une tabulation.
Au type primitif char est associée une classe enveloppante Character , qui contient des fonctions très utiles :
Les conversions entre char et Char se font respectivement à l'aide du constructeur et de la méthode suivante :
Character c = new Character('5'); char d = c.charValue(); // d = '5'