xref: /freebsd/usr.bin/m4/tokenizer.l (revision 4fff7a14aeff79b4a1d515b2ce6b323699ef5b66)
1a841e1ebSBaptiste Daroussin %option nounput noinput
2a841e1ebSBaptiste Daroussin %{
3a841e1ebSBaptiste Daroussin /* $OpenBSD: tokenizer.l,v 1.7 2010/03/22 20:40:44 espie Exp $ */
4a841e1ebSBaptiste Daroussin /*
5a841e1ebSBaptiste Daroussin  * Copyright (c) 2004 Marc Espie <espie@cvs.openbsd.org>
6a841e1ebSBaptiste Daroussin  *
7a841e1ebSBaptiste Daroussin  * Permission to use, copy, modify, and distribute this software for any
8a841e1ebSBaptiste Daroussin  * purpose with or without fee is hereby granted, provided that the above
9a841e1ebSBaptiste Daroussin  * copyright notice and this permission notice appear in all copies.
10a841e1ebSBaptiste Daroussin  *
11a841e1ebSBaptiste Daroussin  * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES
12a841e1ebSBaptiste Daroussin  * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
13a841e1ebSBaptiste Daroussin  * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR
14a841e1ebSBaptiste Daroussin  * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
15a841e1ebSBaptiste Daroussin  * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
16a841e1ebSBaptiste Daroussin  * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
17a841e1ebSBaptiste Daroussin  * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
18a841e1ebSBaptiste Daroussin  *
19a841e1ebSBaptiste Daroussin  * $FreeBSD$
20a841e1ebSBaptiste Daroussin  */
21a841e1ebSBaptiste Daroussin #include "parser.h"
22a841e1ebSBaptiste Daroussin #include <assert.h>
23a841e1ebSBaptiste Daroussin #include <stdlib.h>
24a841e1ebSBaptiste Daroussin #include <errno.h>
25a841e1ebSBaptiste Daroussin #include <stdint.h>
26a841e1ebSBaptiste Daroussin #include <limits.h>
27a841e1ebSBaptiste Daroussin 
28a841e1ebSBaptiste Daroussin extern int mimic_gnu;
29a841e1ebSBaptiste Daroussin extern int32_t yylval;
30a841e1ebSBaptiste Daroussin 
31a841e1ebSBaptiste Daroussin int32_t number(void);
32a841e1ebSBaptiste Daroussin int32_t parse_radix(void);
33a841e1ebSBaptiste Daroussin extern int yylex(void);
34a841e1ebSBaptiste Daroussin %}
35a841e1ebSBaptiste Daroussin 
36a841e1ebSBaptiste Daroussin delim 	[ \t\n]
37a841e1ebSBaptiste Daroussin ws	{delim}+
38a841e1ebSBaptiste Daroussin hex	0[xX][0-9a-fA-F]+
39a841e1ebSBaptiste Daroussin oct	0[0-7]*
40a841e1ebSBaptiste Daroussin dec	[1-9][0-9]*
41a841e1ebSBaptiste Daroussin radix	0[rR][0-9]+:[0-9a-zA-Z]+
42a841e1ebSBaptiste Daroussin 
43a841e1ebSBaptiste Daroussin %%
44a841e1ebSBaptiste Daroussin {ws}			{/* just skip it */}
45a841e1ebSBaptiste Daroussin {hex}|{oct}|{dec}	{ yylval = number(); return(NUMBER); }
46a841e1ebSBaptiste Daroussin {radix}			{ if (mimic_gnu) {
47a841e1ebSBaptiste Daroussin 				yylval = parse_radix(); return(NUMBER);
48a841e1ebSBaptiste Daroussin 			  } else {
49a841e1ebSBaptiste Daroussin 			  	return(ERROR);
50a841e1ebSBaptiste Daroussin 			  }
51a841e1ebSBaptiste Daroussin 			}
52a841e1ebSBaptiste Daroussin "<="			{ return(LE); }
53a841e1ebSBaptiste Daroussin ">="			{ return(GE); }
54a841e1ebSBaptiste Daroussin "<<"			{ return(LSHIFT); }
55a841e1ebSBaptiste Daroussin ">>"			{ return(RSHIFT); }
56a841e1ebSBaptiste Daroussin "=="			{ return(EQ); }
57a841e1ebSBaptiste Daroussin "!="			{ return(NE); }
58a841e1ebSBaptiste Daroussin "&&"			{ return(LAND); }
59a841e1ebSBaptiste Daroussin "||"			{ return(LOR); }
60*4fff7a14SBaptiste Daroussin "**"			{ if (mimic_gnu) { return (EXPONENT); } }
61a841e1ebSBaptiste Daroussin .			{ return yytext[0]; }
62a841e1ebSBaptiste Daroussin %%
63a841e1ebSBaptiste Daroussin 
64a841e1ebSBaptiste Daroussin int32_t
65a841e1ebSBaptiste Daroussin number(void)
66a841e1ebSBaptiste Daroussin {
67a841e1ebSBaptiste Daroussin 	long l;
68a841e1ebSBaptiste Daroussin 
69a841e1ebSBaptiste Daroussin 	errno = 0;
70a841e1ebSBaptiste Daroussin 	l = strtol(yytext, NULL, 0);
71a841e1ebSBaptiste Daroussin 	if (((l == LONG_MAX || l == LONG_MIN) && errno == ERANGE) ||
72a841e1ebSBaptiste Daroussin 	    l > INT32_MAX || l < INT32_MIN) {
73a841e1ebSBaptiste Daroussin 		fprintf(stderr, "m4: numeric overflow in expr: %s\n", yytext);
74a841e1ebSBaptiste Daroussin 	}
75a841e1ebSBaptiste Daroussin 	return l;
76a841e1ebSBaptiste Daroussin }
77a841e1ebSBaptiste Daroussin 
78a841e1ebSBaptiste Daroussin int32_t
79a841e1ebSBaptiste Daroussin parse_radix(void)
80a841e1ebSBaptiste Daroussin {
81a841e1ebSBaptiste Daroussin 	long base;
82a841e1ebSBaptiste Daroussin 	char *next;
83a841e1ebSBaptiste Daroussin 	long l;
84a841e1ebSBaptiste Daroussin 	int d;
85a841e1ebSBaptiste Daroussin 
86a841e1ebSBaptiste Daroussin 	l = 0;
87a841e1ebSBaptiste Daroussin 	base = strtol(yytext+2, &next, 0);
88a841e1ebSBaptiste Daroussin 	if (base > 36 || next == NULL) {
89a841e1ebSBaptiste Daroussin 		fprintf(stderr, "m4: error in number %s\n", yytext);
90a841e1ebSBaptiste Daroussin 	} else {
91a841e1ebSBaptiste Daroussin 		next++;
92a841e1ebSBaptiste Daroussin 		while (*next != 0) {
93a841e1ebSBaptiste Daroussin 			if (*next >= '0' && *next <= '9')
94a841e1ebSBaptiste Daroussin 				d = *next - '0';
95a841e1ebSBaptiste Daroussin 			else if (*next >= 'a' && *next <= 'z')
96a841e1ebSBaptiste Daroussin 				d = *next - 'a' + 10;
97a841e1ebSBaptiste Daroussin 			else {
98a841e1ebSBaptiste Daroussin 				assert(*next >= 'A' && *next <= 'Z');
99a841e1ebSBaptiste Daroussin 				d = *next - 'A' + 10;
100a841e1ebSBaptiste Daroussin 			}
101a841e1ebSBaptiste Daroussin 			if (d >= base) {
102a841e1ebSBaptiste Daroussin 				fprintf(stderr,
103a841e1ebSBaptiste Daroussin 				    "m4: error in number %s\n", yytext);
104a841e1ebSBaptiste Daroussin 				return 0;
105a841e1ebSBaptiste Daroussin 			}
106a841e1ebSBaptiste Daroussin 			l = base * l + d;
107a841e1ebSBaptiste Daroussin 			next++;
108a841e1ebSBaptiste Daroussin 		}
109a841e1ebSBaptiste Daroussin 	}
110a841e1ebSBaptiste Daroussin 	return l;
111a841e1ebSBaptiste Daroussin }
112a841e1ebSBaptiste Daroussin 
113