xref: /freebsd/contrib/libucl/src/ucl_sexp.c (revision d9f0ce31900a48d1a2bfc1c8c86f79d1e831451a)
139ee7a7aSBaptiste Daroussin /*
239ee7a7aSBaptiste Daroussin  * Copyright (c) 2015, Vsevolod Stakhov
339ee7a7aSBaptiste Daroussin  * All rights reserved.
439ee7a7aSBaptiste Daroussin  *
539ee7a7aSBaptiste Daroussin  * Redistribution and use in source and binary forms, with or without
639ee7a7aSBaptiste Daroussin  * modification, are permitted provided that the following conditions are met:
739ee7a7aSBaptiste Daroussin  *	 * Redistributions of source code must retain the above copyright
839ee7a7aSBaptiste Daroussin  *	   notice, this list of conditions and the following disclaimer.
939ee7a7aSBaptiste Daroussin  *	 * Redistributions in binary form must reproduce the above copyright
1039ee7a7aSBaptiste Daroussin  *	   notice, this list of conditions and the following disclaimer in the
1139ee7a7aSBaptiste Daroussin  *	   documentation and/or other materials provided with the distribution.
1239ee7a7aSBaptiste Daroussin  *
1339ee7a7aSBaptiste Daroussin  * THIS SOFTWARE IS PROVIDED BY AUTHOR ''AS IS'' AND ANY
1439ee7a7aSBaptiste Daroussin  * EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED
1539ee7a7aSBaptiste Daroussin  * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
1639ee7a7aSBaptiste Daroussin  * DISCLAIMED. IN NO EVENT SHALL AUTHOR BE LIABLE FOR ANY
1739ee7a7aSBaptiste Daroussin  * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
1839ee7a7aSBaptiste Daroussin  * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;
1939ee7a7aSBaptiste Daroussin  * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
2039ee7a7aSBaptiste Daroussin  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
2139ee7a7aSBaptiste Daroussin  * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
2239ee7a7aSBaptiste Daroussin  * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
2339ee7a7aSBaptiste Daroussin  */
2439ee7a7aSBaptiste Daroussin 
2539ee7a7aSBaptiste Daroussin #ifdef HAVE_CONFIG_H
2639ee7a7aSBaptiste Daroussin #include "config.h"
2739ee7a7aSBaptiste Daroussin #endif
2839ee7a7aSBaptiste Daroussin 
2939ee7a7aSBaptiste Daroussin #include <ucl.h>
3039ee7a7aSBaptiste Daroussin #include "ucl.h"
3139ee7a7aSBaptiste Daroussin #include "ucl_internal.h"
3239ee7a7aSBaptiste Daroussin #include "utlist.h"
3339ee7a7aSBaptiste Daroussin 
3439ee7a7aSBaptiste Daroussin #define NEXT_STATE do {            \
3539ee7a7aSBaptiste Daroussin if (p >= end) {                    \
3639ee7a7aSBaptiste Daroussin     if (state != read_ebrace) {    \
3739ee7a7aSBaptiste Daroussin       ucl_create_err (&parser->err,\
3839ee7a7aSBaptiste Daroussin                      "extra data");\
3939ee7a7aSBaptiste Daroussin       state = parse_err;           \
4039ee7a7aSBaptiste Daroussin     }                              \
4139ee7a7aSBaptiste Daroussin }                                  \
4239ee7a7aSBaptiste Daroussin else {                             \
4339ee7a7aSBaptiste Daroussin switch (*p) {                      \
4439ee7a7aSBaptiste Daroussin     case '(':                      \
4539ee7a7aSBaptiste Daroussin         state = read_obrace;       \
4639ee7a7aSBaptiste Daroussin         break;                     \
4739ee7a7aSBaptiste Daroussin     case ')':                      \
4839ee7a7aSBaptiste Daroussin         state = read_ebrace;       \
4939ee7a7aSBaptiste Daroussin         break;                     \
5039ee7a7aSBaptiste Daroussin     default:                       \
5139ee7a7aSBaptiste Daroussin         len = 0;                   \
5239ee7a7aSBaptiste Daroussin         mult = 1;                  \
5339ee7a7aSBaptiste Daroussin         state = read_length;       \
5439ee7a7aSBaptiste Daroussin         break;                     \
5539ee7a7aSBaptiste Daroussin     }                              \
5639ee7a7aSBaptiste Daroussin }                                  \
5739ee7a7aSBaptiste Daroussin } while(0)
5839ee7a7aSBaptiste Daroussin 
5939ee7a7aSBaptiste Daroussin bool
ucl_parse_csexp(struct ucl_parser * parser)6039ee7a7aSBaptiste Daroussin ucl_parse_csexp (struct ucl_parser *parser)
6139ee7a7aSBaptiste Daroussin {
6239ee7a7aSBaptiste Daroussin 	const unsigned char *p, *end;
6339ee7a7aSBaptiste Daroussin 	ucl_object_t *obj;
6439ee7a7aSBaptiste Daroussin 	struct ucl_stack *st;
6539ee7a7aSBaptiste Daroussin 	uint64_t len = 0, mult = 1;
6639ee7a7aSBaptiste Daroussin 	enum {
6739ee7a7aSBaptiste Daroussin 		start_parse,
6839ee7a7aSBaptiste Daroussin 		read_obrace,
6939ee7a7aSBaptiste Daroussin 		read_length,
7039ee7a7aSBaptiste Daroussin 		read_value,
7139ee7a7aSBaptiste Daroussin 		read_ebrace,
7239ee7a7aSBaptiste Daroussin 		parse_err
7339ee7a7aSBaptiste Daroussin 	} state = start_parse;
7439ee7a7aSBaptiste Daroussin 
7539ee7a7aSBaptiste Daroussin 	assert (parser != NULL);
7639ee7a7aSBaptiste Daroussin 	assert (parser->chunks != NULL);
7739ee7a7aSBaptiste Daroussin 	assert (parser->chunks->begin != NULL);
7839ee7a7aSBaptiste Daroussin 	assert (parser->chunks->remain != 0);
7939ee7a7aSBaptiste Daroussin 
8039ee7a7aSBaptiste Daroussin 	p = parser->chunks->begin;
8139ee7a7aSBaptiste Daroussin 	end = p + parser->chunks->remain;
8239ee7a7aSBaptiste Daroussin 
8339ee7a7aSBaptiste Daroussin 	while (p < end) {
8439ee7a7aSBaptiste Daroussin 		switch (state) {
8539ee7a7aSBaptiste Daroussin 		case start_parse:
8639ee7a7aSBaptiste Daroussin 			/* At this point we expect open brace */
8739ee7a7aSBaptiste Daroussin 			if (*p == '(') {
8839ee7a7aSBaptiste Daroussin 				state = read_obrace;
8939ee7a7aSBaptiste Daroussin 			}
9039ee7a7aSBaptiste Daroussin 			else {
9139ee7a7aSBaptiste Daroussin 				ucl_create_err (&parser->err, "bad starting character for "
9239ee7a7aSBaptiste Daroussin 						"sexp block: %x", (int)*p);
9339ee7a7aSBaptiste Daroussin 				state = parse_err;
9439ee7a7aSBaptiste Daroussin 			}
9539ee7a7aSBaptiste Daroussin 			break;
9639ee7a7aSBaptiste Daroussin 
9739ee7a7aSBaptiste Daroussin 		case read_obrace:
9839ee7a7aSBaptiste Daroussin 			st = calloc (1, sizeof (*st));
9939ee7a7aSBaptiste Daroussin 
10039ee7a7aSBaptiste Daroussin 			if (st == NULL) {
10139ee7a7aSBaptiste Daroussin 				ucl_create_err (&parser->err, "no memory");
10239ee7a7aSBaptiste Daroussin 				state = parse_err;
10339ee7a7aSBaptiste Daroussin 				continue;
10439ee7a7aSBaptiste Daroussin 			}
10539ee7a7aSBaptiste Daroussin 
10639ee7a7aSBaptiste Daroussin 			st->obj = ucl_object_typed_new (UCL_ARRAY);
10739ee7a7aSBaptiste Daroussin 
10839ee7a7aSBaptiste Daroussin 			if (st->obj == NULL) {
10939ee7a7aSBaptiste Daroussin 				ucl_create_err (&parser->err, "no memory");
11039ee7a7aSBaptiste Daroussin 				state = parse_err;
111*d9f0ce31SBaptiste Daroussin 				free (st);
11239ee7a7aSBaptiste Daroussin 				continue;
11339ee7a7aSBaptiste Daroussin 			}
11439ee7a7aSBaptiste Daroussin 
11539ee7a7aSBaptiste Daroussin 			if (parser->stack == NULL) {
11639ee7a7aSBaptiste Daroussin 				/* We have no stack */
11739ee7a7aSBaptiste Daroussin 				parser->stack = st;
11839ee7a7aSBaptiste Daroussin 
11939ee7a7aSBaptiste Daroussin 				if (parser->top_obj == NULL) {
12039ee7a7aSBaptiste Daroussin 					parser->top_obj = st->obj;
12139ee7a7aSBaptiste Daroussin 				}
12239ee7a7aSBaptiste Daroussin 			}
12339ee7a7aSBaptiste Daroussin 			else {
12439ee7a7aSBaptiste Daroussin 				/* Prepend new element to the stack */
12539ee7a7aSBaptiste Daroussin 				LL_PREPEND (parser->stack, st);
12639ee7a7aSBaptiste Daroussin 			}
12739ee7a7aSBaptiste Daroussin 
12839ee7a7aSBaptiste Daroussin 			p ++;
12939ee7a7aSBaptiste Daroussin 			NEXT_STATE;
13039ee7a7aSBaptiste Daroussin 
13139ee7a7aSBaptiste Daroussin 			break;
13239ee7a7aSBaptiste Daroussin 
13339ee7a7aSBaptiste Daroussin 		case read_length:
13439ee7a7aSBaptiste Daroussin 			if (*p == ':') {
13539ee7a7aSBaptiste Daroussin 				if (len == 0) {
13639ee7a7aSBaptiste Daroussin 					ucl_create_err (&parser->err, "zero length element");
13739ee7a7aSBaptiste Daroussin 					state = parse_err;
13839ee7a7aSBaptiste Daroussin 					continue;
13939ee7a7aSBaptiste Daroussin 				}
14039ee7a7aSBaptiste Daroussin 
14139ee7a7aSBaptiste Daroussin 				state = read_value;
14239ee7a7aSBaptiste Daroussin 			}
14339ee7a7aSBaptiste Daroussin 			else if (*p >= '0' && *p <= '9') {
14439ee7a7aSBaptiste Daroussin 				len += (*p - '0') * mult;
14539ee7a7aSBaptiste Daroussin 				mult *= 10;
14639ee7a7aSBaptiste Daroussin 
14739ee7a7aSBaptiste Daroussin 				if (len > UINT32_MAX) {
14839ee7a7aSBaptiste Daroussin 					ucl_create_err (&parser->err, "too big length of an "
14939ee7a7aSBaptiste Daroussin 									"element");
15039ee7a7aSBaptiste Daroussin 					state = parse_err;
15139ee7a7aSBaptiste Daroussin 					continue;
15239ee7a7aSBaptiste Daroussin 				}
15339ee7a7aSBaptiste Daroussin 			}
15439ee7a7aSBaptiste Daroussin 			else {
15539ee7a7aSBaptiste Daroussin 				ucl_create_err (&parser->err, "bad length character: %x",
15639ee7a7aSBaptiste Daroussin 						(int)*p);
15739ee7a7aSBaptiste Daroussin 				state = parse_err;
15839ee7a7aSBaptiste Daroussin 				continue;
15939ee7a7aSBaptiste Daroussin 			}
16039ee7a7aSBaptiste Daroussin 
16139ee7a7aSBaptiste Daroussin 			p ++;
16239ee7a7aSBaptiste Daroussin 			break;
16339ee7a7aSBaptiste Daroussin 
16439ee7a7aSBaptiste Daroussin 		case read_value:
16539ee7a7aSBaptiste Daroussin 			if ((uint64_t)(end - p) > len || len == 0) {
16639ee7a7aSBaptiste Daroussin 				ucl_create_err (&parser->err, "invalid length: %llu, %ld "
16739ee7a7aSBaptiste Daroussin 						"remain", (long long unsigned)len, (long)(end - p));
16839ee7a7aSBaptiste Daroussin 				state = parse_err;
16939ee7a7aSBaptiste Daroussin 				continue;
17039ee7a7aSBaptiste Daroussin 			}
17139ee7a7aSBaptiste Daroussin 			obj = ucl_object_typed_new (UCL_STRING);
17239ee7a7aSBaptiste Daroussin 
17339ee7a7aSBaptiste Daroussin 			obj->value.sv = (const char*)p;
17439ee7a7aSBaptiste Daroussin 			obj->len = len;
17539ee7a7aSBaptiste Daroussin 			obj->flags |= UCL_OBJECT_BINARY;
17639ee7a7aSBaptiste Daroussin 
17739ee7a7aSBaptiste Daroussin 			if (!(parser->flags & UCL_PARSER_ZEROCOPY)) {
17839ee7a7aSBaptiste Daroussin 				ucl_copy_value_trash (obj);
17939ee7a7aSBaptiste Daroussin 			}
18039ee7a7aSBaptiste Daroussin 
18139ee7a7aSBaptiste Daroussin 			ucl_array_append (parser->stack->obj, obj);
18239ee7a7aSBaptiste Daroussin 			p += len;
18339ee7a7aSBaptiste Daroussin 			NEXT_STATE;
18439ee7a7aSBaptiste Daroussin 			break;
18539ee7a7aSBaptiste Daroussin 
18639ee7a7aSBaptiste Daroussin 		case read_ebrace:
18739ee7a7aSBaptiste Daroussin 			if (parser->stack == NULL) {
18839ee7a7aSBaptiste Daroussin 				/* We have an extra end brace */
18939ee7a7aSBaptiste Daroussin 				ucl_create_err (&parser->err, "invalid length: %llu, %ld "
19039ee7a7aSBaptiste Daroussin 						"remain", (long long unsigned)len, (long)(end - p));
19139ee7a7aSBaptiste Daroussin 				state = parse_err;
19239ee7a7aSBaptiste Daroussin 				continue;
19339ee7a7aSBaptiste Daroussin 			}
19439ee7a7aSBaptiste Daroussin 			/* Pop the container */
19539ee7a7aSBaptiste Daroussin 			st = parser->stack;
19639ee7a7aSBaptiste Daroussin 			parser->stack = st->next;
19739ee7a7aSBaptiste Daroussin 
19839ee7a7aSBaptiste Daroussin 			if (parser->stack->obj->type == UCL_ARRAY) {
19939ee7a7aSBaptiste Daroussin 				ucl_array_append (parser->stack->obj, st->obj);
20039ee7a7aSBaptiste Daroussin 			}
20139ee7a7aSBaptiste Daroussin 			else {
20239ee7a7aSBaptiste Daroussin 				ucl_create_err (&parser->err, "bad container object, array "
20339ee7a7aSBaptiste Daroussin 						"expected");
20439ee7a7aSBaptiste Daroussin 				state = parse_err;
20539ee7a7aSBaptiste Daroussin 				continue;
20639ee7a7aSBaptiste Daroussin 			}
20739ee7a7aSBaptiste Daroussin 
20839ee7a7aSBaptiste Daroussin 			free (st);
209*d9f0ce31SBaptiste Daroussin 			st = NULL;
21039ee7a7aSBaptiste Daroussin 			p++;
21139ee7a7aSBaptiste Daroussin 			NEXT_STATE;
21239ee7a7aSBaptiste Daroussin 			break;
21339ee7a7aSBaptiste Daroussin 
21439ee7a7aSBaptiste Daroussin 		case parse_err:
21539ee7a7aSBaptiste Daroussin 		default:
21639ee7a7aSBaptiste Daroussin 			return false;
21739ee7a7aSBaptiste Daroussin 		}
21839ee7a7aSBaptiste Daroussin 	}
21939ee7a7aSBaptiste Daroussin 
22039ee7a7aSBaptiste Daroussin 	if (state != read_ebrace) {
22139ee7a7aSBaptiste Daroussin 		ucl_create_err (&parser->err, "invalid finishing state: %d", state);
22239ee7a7aSBaptiste Daroussin 		return false;
22339ee7a7aSBaptiste Daroussin 	}
22439ee7a7aSBaptiste Daroussin 
22539ee7a7aSBaptiste Daroussin 	return true;
22639ee7a7aSBaptiste Daroussin }
227