xref: /freebsd/sys/net/if_llatbl.c (revision a4128aad8503277614f2d214011ef60a19447b83)
1 /*-
2  * SPDX-License-Identifier: BSD-2-Clause
3  *
4  * Copyright (c) 2004 Luigi Rizzo, Alessandro Cerri. All rights reserved.
5  * Copyright (c) 2004-2008 Qing Li. All rights reserved.
6  * Copyright (c) 2008 Kip Macy. All rights reserved.
7  *
8  * Redistribution and use in source and binary forms, with or without
9  * modification, are permitted provided that the following conditions
10  * are met:
11  * 1. Redistributions of source code must retain the above copyright
12  *    notice, this list of conditions and the following disclaimer.
13  * 2. Redistributions in binary form must reproduce the above copyright
14  *    notice, this list of conditions and the following disclaimer in the
15  *    documentation and/or other materials provided with the distribution.
16  *
17  * THIS SOFTWARE IS PROVIDED BY AUTHOR AND CONTRIBUTORS ``AS IS'' AND
18  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
19  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
20  * ARE DISCLAIMED.  IN NO EVENT SHALL AUTHOR OR CONTRIBUTORS BE LIABLE
21  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
22  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
23  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
24  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
25  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
26  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
27  * SUCH DAMAGE.
28  */
29 #include <sys/cdefs.h>
30 #include "opt_ddb.h"
31 #include "opt_inet.h"
32 #include "opt_inet6.h"
33 
34 #include <sys/param.h>
35 #include <sys/systm.h>
36 #include <sys/eventhandler.h>
37 #include <sys/malloc.h>
38 #include <sys/mbuf.h>
39 #include <sys/syslog.h>
40 #include <sys/sysctl.h>
41 #include <sys/socket.h>
42 #include <sys/kernel.h>
43 #include <sys/lock.h>
44 #include <sys/mutex.h>
45 #include <sys/rwlock.h>
46 
47 #ifdef DDB
48 #include <ddb/ddb.h>
49 #endif
50 
51 #include <vm/uma.h>
52 
53 #include <netinet/in.h>
54 #include <net/if_llatbl.h>
55 #include <net/if.h>
56 #include <net/if_dl.h>
57 #include <net/if_var.h>
58 #include <net/if_private.h>
59 #include <net/route.h>
60 #include <net/route/route_ctl.h>
61 #include <net/route/route_debug.h>
62 #include <net/vnet.h>
63 #include <netinet/if_ether.h>
64 #include <netinet6/in6_var.h>
65 #include <netinet6/nd6.h>
66 
67 MALLOC_DEFINE(M_LLTABLE, "lltable", "link level address tables");
68 
69 VNET_DEFINE_STATIC(SLIST_HEAD(, lltable), lltables) =
70     SLIST_HEAD_INITIALIZER(lltables);
71 #define	V_lltables	VNET(lltables)
72 
73 static struct rwlock lltable_list_lock;
74 RW_SYSINIT(lltable_list_lock, &lltable_list_lock, "lltable_list_lock");
75 #define	LLTABLE_LIST_RLOCK()		rw_rlock(&lltable_list_lock)
76 #define	LLTABLE_LIST_RUNLOCK()		rw_runlock(&lltable_list_lock)
77 #define	LLTABLE_LIST_WLOCK()		rw_wlock(&lltable_list_lock)
78 #define	LLTABLE_LIST_WUNLOCK()		rw_wunlock(&lltable_list_lock)
79 #define	LLTABLE_LIST_LOCK_ASSERT()	rw_assert(&lltable_list_lock, RA_LOCKED)
80 
81 static void lltable_unlink(struct lltable *llt);
82 static void llentries_unlink(struct lltable *llt, struct llentries *head);
83 
84 /*
85  * Dump lle state for a specific address family.
86  */
87 static int
88 lltable_dump_af(struct lltable *llt, struct sysctl_req *wr)
89 {
90 	struct epoch_tracker et;
91 	int error;
92 
93 	LLTABLE_LIST_LOCK_ASSERT();
94 
95 	if (llt->llt_ifp->if_flags & IFF_LOOPBACK)
96 		return (0);
97 	error = 0;
98 
99 	NET_EPOCH_ENTER(et);
100 	error = lltable_foreach_lle(llt,
101 	    (llt_foreach_cb_t *)llt->llt_dump_entry, wr);
102 	NET_EPOCH_EXIT(et);
103 
104 	return (error);
105 }
106 
107 /*
108  * Dump arp state for a specific address family.
109  */
110 int
111 lltable_sysctl_dumparp(int af, struct sysctl_req *wr)
112 {
113 	struct lltable *llt;
114 	int error = 0;
115 
116 	LLTABLE_LIST_RLOCK();
117 	SLIST_FOREACH(llt, &V_lltables, llt_link) {
118 		if (llt->llt_af == af) {
119 			error = lltable_dump_af(llt, wr);
120 			if (error != 0)
121 				goto done;
122 		}
123 	}
124 done:
125 	LLTABLE_LIST_RUNLOCK();
126 	return (error);
127 }
128 
129 /*
130  * Adds a mbuf to hold queue. Drops old packets if the queue is full.
131  *
132  * Returns the number of held packets that were dropped.
133  */
134 size_t
135 lltable_append_entry_queue(struct llentry *lle, struct mbuf *m,
136     size_t maxheld)
137 {
138 	size_t pkts_dropped = 0;
139 
140 	LLE_WLOCK_ASSERT(lle);
141 
142 	while (lle->la_numheld >= maxheld && lle->la_hold != NULL) {
143 		struct mbuf *next = lle->la_hold->m_nextpkt;
144 		m_freem(lle->la_hold);
145 		lle->la_hold = next;
146 		lle->la_numheld--;
147 		pkts_dropped++;
148 	}
149 
150 	if (lle->la_hold != NULL) {
151 		struct mbuf *curr = lle->la_hold;
152 		while (curr->m_nextpkt != NULL)
153 			curr = curr->m_nextpkt;
154 		curr->m_nextpkt = m;
155 	} else
156 		lle->la_hold = m;
157 
158 	lle->la_numheld++;
159 
160 	return pkts_dropped;
161 }
162 
163 
164 /*
165  * Common function helpers for chained hash table.
166  */
167 
168 /*
169  * Runs specified callback for each entry in @llt.
170  * Caller does the locking.
171  *
172  */
173 static int
174 htable_foreach_lle(struct lltable *llt, llt_foreach_cb_t *f, void *farg)
175 {
176 	struct llentry *lle, *next;
177 	int i, error;
178 
179 	error = 0;
180 
181 	for (i = 0; i < llt->llt_hsize; i++) {
182 		CK_LIST_FOREACH_SAFE(lle, &llt->lle_head[i], lle_next, next) {
183 			error = f(llt, lle, farg);
184 			if (error != 0)
185 				break;
186 		}
187 	}
188 
189 	return (error);
190 }
191 
192 /*
193  * The htable_[un]link_entry() functions return:
194  * 0 if the entry was (un)linked already and nothing changed,
195  * 1 if the entry was added/removed to/from the table, and
196  * -1 on error (e.g., not being able to add the entry due to limits reached).
197  * While the "unlink" operation should never error, callers of
198  * lltable_link_entry() need to check for errors and handle them.
199  */
200 static int
201 htable_link_entry(struct lltable *llt, struct llentry *lle)
202 {
203 	struct llentries *lleh;
204 	uint32_t hashidx;
205 
206 	if ((lle->la_flags & LLE_LINKED) != 0)
207 		return (0);
208 
209 	IF_AFDATA_WLOCK_ASSERT(llt->llt_ifp);
210 
211 	if (llt->llt_maxentries > 0 &&
212 	    llt->llt_entries >= llt->llt_maxentries)
213 		return (-1);
214 
215 	hashidx = llt->llt_hash(lle, llt->llt_hsize);
216 	lleh = &llt->lle_head[hashidx];
217 
218 	lle->lle_tbl  = llt;
219 	lle->lle_head = lleh;
220 	lle->la_flags |= LLE_LINKED;
221 	CK_LIST_INSERT_HEAD(lleh, lle, lle_next);
222 	llt->llt_entries++;
223 
224 	return (1);
225 }
226 
227 static int
228 htable_unlink_entry(struct llentry *lle)
229 {
230 	struct lltable *llt;
231 
232 	if ((lle->la_flags & LLE_LINKED) == 0)
233 		return (0);
234 
235 	llt = lle->lle_tbl;
236 	IF_AFDATA_WLOCK_ASSERT(llt->llt_ifp);
237 	KASSERT(llt->llt_entries > 0, ("%s: lltable %p (%s) entries %d <= 0",
238 	    __func__, llt, if_name(llt->llt_ifp), llt->llt_entries));
239 
240 	CK_LIST_REMOVE(lle, lle_next);
241 	lle->la_flags &= ~(LLE_VALID | LLE_LINKED);
242 #if 0
243 	lle->lle_tbl = NULL;
244 	lle->lle_head = NULL;
245 #endif
246 	llt->llt_entries--;
247 
248 	return (1);
249 }
250 
251 struct prefix_match_data {
252 	const struct sockaddr *addr;
253 	const struct sockaddr *mask;
254 	struct llentries dchain;
255 	u_int flags;
256 };
257 
258 static int
259 htable_prefix_free_cb(struct lltable *llt, struct llentry *lle, void *farg)
260 {
261 	struct prefix_match_data *pmd;
262 
263 	pmd = (struct prefix_match_data *)farg;
264 
265 	if (llt->llt_match_prefix(pmd->addr, pmd->mask, pmd->flags, lle)) {
266 		LLE_WLOCK(lle);
267 		CK_LIST_INSERT_HEAD(&pmd->dchain, lle, lle_chain);
268 	}
269 
270 	return (0);
271 }
272 
273 static void
274 htable_prefix_free(struct lltable *llt, const struct sockaddr *addr,
275     const struct sockaddr *mask, u_int flags)
276 {
277 	struct llentry *lle, *next;
278 	struct prefix_match_data pmd;
279 
280 	bzero(&pmd, sizeof(pmd));
281 	pmd.addr = addr;
282 	pmd.mask = mask;
283 	pmd.flags = flags;
284 	CK_LIST_INIT(&pmd.dchain);
285 
286 	IF_AFDATA_WLOCK(llt->llt_ifp);
287 	/* Push matching lles to chain */
288 	lltable_foreach_lle(llt, htable_prefix_free_cb, &pmd);
289 
290 	llentries_unlink(llt, &pmd.dchain);
291 	IF_AFDATA_WUNLOCK(llt->llt_ifp);
292 
293 	CK_LIST_FOREACH_SAFE(lle, &pmd.dchain, lle_chain, next)
294 		lltable_free_entry(llt, lle);
295 }
296 
297 static void
298 htable_free_tbl(struct lltable *llt)
299 {
300 
301 	free(llt->lle_head, M_LLTABLE);
302 	free(llt, M_LLTABLE);
303 }
304 
305 static void
306 llentries_unlink(struct lltable *llt, struct llentries *head)
307 {
308 	struct llentry *lle, *next;
309 
310 	CK_LIST_FOREACH_SAFE(lle, head, lle_chain, next)
311 		llt->llt_unlink_entry(lle);
312 }
313 
314 /*
315  * Helper function used to drop all mbufs in hold queue.
316  *
317  * Returns the number of held packets, if any, that were dropped.
318  */
319 size_t
320 lltable_drop_entry_queue(struct llentry *lle)
321 {
322 	size_t pkts_dropped = 0;
323 
324 	LLE_WLOCK_ASSERT(lle);
325 
326 	while (lle->la_hold != NULL) {
327 		struct mbuf *next = lle->la_hold->m_nextpkt;
328 		m_freem(lle->la_hold);
329 		lle->la_hold = next;
330 		lle->la_numheld--;
331 		pkts_dropped++;
332 	}
333 
334 	KASSERT(lle->la_numheld == 0,
335 		("%s: la_numheld %d > 0, pkts_dropped %zd", __func__,
336 		 lle->la_numheld, pkts_dropped));
337 
338 	return (pkts_dropped);
339 }
340 
341 void
342 lltable_set_entry_addr(struct ifnet *ifp, struct llentry *lle,
343     const char *linkhdr, size_t linkhdrsize, int lladdr_off)
344 {
345 
346 	memcpy(lle->r_linkdata, linkhdr, linkhdrsize);
347 	lle->r_hdrlen = linkhdrsize;
348 	lle->ll_addr = &lle->r_linkdata[lladdr_off];
349 	lle->la_flags |= LLE_VALID;
350 	lle->r_flags |= RLLE_VALID;
351 }
352 
353 /*
354  * Acquires lltable write lock.
355  *
356  * Returns true on success, with both lltable and lle lock held.
357  * On failure, false is returned and lle wlock is still held.
358  */
359 bool
360 lltable_acquire_wlock(struct ifnet *ifp, struct llentry *lle)
361 {
362 	NET_EPOCH_ASSERT();
363 
364 	/* Perform real LLE update */
365 	/* use afdata WLOCK to update fields */
366 	LLE_WUNLOCK(lle);
367 	IF_AFDATA_WLOCK(ifp);
368 	LLE_WLOCK(lle);
369 
370 	/*
371 	 * Since we droppped LLE lock, other thread might have deleted
372 	 * this lle. Check and return
373 	 */
374 	if ((lle->la_flags & LLE_DELETED) != 0) {
375 		IF_AFDATA_WUNLOCK(ifp);
376 		return (false);
377 	}
378 
379 	return (true);
380 }
381 
382 /*
383  * Tries to update @lle link-level address.
384  * Since update requires AFDATA WLOCK, function
385  * drops @lle lock, acquires AFDATA lock and then acquires
386  * @lle lock to maintain lock order.
387  *
388  * Returns 1 on success.
389  */
390 int
391 lltable_try_set_entry_addr(struct ifnet *ifp, struct llentry *lle,
392     const char *linkhdr, size_t linkhdrsize, int lladdr_off)
393 {
394 
395 	if (!lltable_acquire_wlock(ifp, lle))
396 		return (0);
397 
398 	/* Update data */
399 	lltable_set_entry_addr(ifp, lle, linkhdr, linkhdrsize, lladdr_off);
400 
401 	IF_AFDATA_WUNLOCK(ifp);
402 
403 	return (1);
404 }
405 
406  /*
407  * Helper function used to pre-compute full/partial link-layer
408  * header data suitable for feeding into if_output().
409  */
410 int
411 lltable_calc_llheader(struct ifnet *ifp, int family, char *lladdr,
412     char *buf, size_t *bufsize, int *lladdr_off)
413 {
414 	struct if_encap_req ereq;
415 	int error;
416 
417 	bzero(buf, *bufsize);
418 	bzero(&ereq, sizeof(ereq));
419 	ereq.buf = buf;
420 	ereq.bufsize = *bufsize;
421 	ereq.rtype = IFENCAP_LL;
422 	ereq.family = family;
423 	ereq.lladdr = lladdr;
424 	ereq.lladdr_len = ifp->if_addrlen;
425 	error = ifp->if_requestencap(ifp, &ereq);
426 	if (error == 0) {
427 		*bufsize = ereq.bufsize;
428 		*lladdr_off = ereq.lladdr_off;
429 	}
430 
431 	return (error);
432 }
433 
434 /*
435  * Searches for the child entry matching @family inside @lle.
436  * Returns the entry or NULL.
437  */
438 struct llentry *
439 llentry_lookup_family(struct llentry *lle, int family)
440 {
441 	struct llentry *child_lle;
442 
443 	if (lle == NULL)
444 		return (NULL);
445 
446 	CK_SLIST_FOREACH(child_lle, &lle->lle_children, lle_child_next) {
447 		if (child_lle->r_family == family)
448 			return (child_lle);
449 	}
450 
451 	return (NULL);
452 }
453 
454 /*
455  * Retrieves upper protocol family for the llentry.
456  * By default, all "normal" (e.g. upper_family == transport_family)
457  * llentries have r_family set to 0.
458  * Thus, use @default_family in that regard, otherwise use r_family.
459  *
460  * Returns upper protocol family
461  */
462 int
463 llentry_get_upper_family(const struct llentry *lle, int default_family)
464 {
465 	return (lle->r_family == 0 ? default_family : lle->r_family);
466 }
467 
468 /*
469  * Prints llentry @lle data into provided buffer.
470  * Example: lle/inet/valid/em0/1.2.3.4
471  *
472  * Returns @buf.
473  */
474 char *
475 llentry_print_buf(const struct llentry *lle, struct ifnet *ifp, int family,
476     char *buf, size_t bufsize)
477 {
478 #if defined(INET) || defined(INET6)
479 	char abuf[INET6_ADDRSTRLEN];
480 #endif
481 
482 	const char *valid = (lle->r_flags & RLLE_VALID) ? "valid" : "no_l2";
483 	const char *upper_str = rib_print_family(llentry_get_upper_family(lle, family));
484 
485 	switch (family) {
486 #ifdef INET
487 	case AF_INET:
488 		inet_ntop(AF_INET, &lle->r_l3addr.addr4, abuf, sizeof(abuf));
489 		snprintf(buf, bufsize, "lle/%s/%s/%s/%s", upper_str,
490 		    valid, if_name(ifp), abuf);
491 		break;
492 #endif
493 #ifdef INET6
494 	case AF_INET6:
495 		inet_ntop(AF_INET6, &lle->r_l3addr.addr6, abuf, sizeof(abuf));
496 		snprintf(buf, bufsize, "lle/%s/%s/%s/%s", upper_str,
497 		    valid, if_name(ifp), abuf);
498 		break;
499 #endif
500 	default:
501 		snprintf(buf, bufsize, "lle/%s/%s/%s/????", upper_str,
502 		    valid, if_name(ifp));
503 		break;
504 	}
505 
506 	return (buf);
507 }
508 
509 char *
510 llentry_print_buf_lltable(const struct llentry *lle, char *buf, size_t bufsize)
511 {
512 	struct lltable *tbl = lle->lle_tbl;
513 
514 	return (llentry_print_buf(lle, lltable_get_ifp(tbl), lltable_get_af(tbl), buf, bufsize));
515 }
516 
517 /*
518  * Requests feedback from the datapath.
519  * First packet using @lle should result in
520  * setting r_skip_req back to 0 and updating
521  * lle_hittime to the current time_uptime.
522  */
523 void
524 llentry_request_feedback(struct llentry *lle)
525 {
526 	struct llentry *child_lle;
527 
528 	LLE_REQ_LOCK(lle);
529 	lle->r_skip_req = 1;
530 	LLE_REQ_UNLOCK(lle);
531 
532 	CK_SLIST_FOREACH(child_lle, &lle->lle_children, lle_child_next) {
533 		LLE_REQ_LOCK(child_lle);
534 		child_lle->r_skip_req = 1;
535 		LLE_REQ_UNLOCK(child_lle);
536 	}
537 }
538 
539 /*
540  * Updates the lle state to mark it has been used
541  * and record the time.
542  * Used by the llentry_provide_feedback() wrapper.
543  */
544 void
545 llentry_mark_used(struct llentry *lle)
546 {
547 	LLE_REQ_LOCK(lle);
548 	lle->r_skip_req = 0;
549 	lle->lle_hittime = time_uptime;
550 	LLE_REQ_UNLOCK(lle);
551 }
552 
553 /*
554  * Fetches the time when lle was used.
555  * Return 0 if the entry was not used, relevant time_uptime
556  *  otherwise.
557  */
558 static time_t
559 llentry_get_hittime_raw(struct llentry *lle)
560 {
561 	time_t lle_hittime = 0;
562 
563 	LLE_REQ_LOCK(lle);
564 	if ((lle->r_skip_req == 0) && (lle_hittime < lle->lle_hittime))
565 		lle_hittime = lle->lle_hittime;
566 	LLE_REQ_UNLOCK(lle);
567 
568 	return (lle_hittime);
569 }
570 
571 time_t
572 llentry_get_hittime(struct llentry *lle)
573 {
574 	time_t lle_hittime = 0;
575 	struct llentry *child_lle;
576 
577 	lle_hittime = llentry_get_hittime_raw(lle);
578 
579 	CK_SLIST_FOREACH(child_lle, &lle->lle_children, lle_child_next) {
580 		time_t hittime = llentry_get_hittime_raw(child_lle);
581 		if (hittime > lle_hittime)
582 			lle_hittime = hittime;
583 	}
584 
585 	return (lle_hittime);
586 }
587 
588 /*
589  * Update link-layer header for given @lle after
590  * interface lladdr was changed.
591  */
592 static int
593 llentry_update_ifaddr(struct lltable *llt, struct llentry *lle, void *farg)
594 {
595 	struct ifnet *ifp;
596 	u_char linkhdr[LLE_MAX_LINKHDR];
597 	size_t linkhdrsize;
598 	u_char *lladdr;
599 	int lladdr_off;
600 
601 	ifp = (struct ifnet *)farg;
602 
603 	lladdr = lle->ll_addr;
604 
605 	LLE_WLOCK(lle);
606 	if ((lle->la_flags & LLE_VALID) == 0) {
607 		LLE_WUNLOCK(lle);
608 		return (0);
609 	}
610 
611 	if ((lle->la_flags & LLE_IFADDR) != 0)
612 		lladdr = IF_LLADDR(ifp);
613 
614 	linkhdrsize = sizeof(linkhdr);
615 	lltable_calc_llheader(ifp, llt->llt_af, lladdr, linkhdr, &linkhdrsize,
616 	    &lladdr_off);
617 	memcpy(lle->r_linkdata, linkhdr, linkhdrsize);
618 	LLE_WUNLOCK(lle);
619 
620 	return (0);
621 }
622 
623 /*
624  * Update all calculated headers for given @llt
625  */
626 void
627 lltable_update_ifaddr(struct lltable *llt)
628 {
629 
630 	if (llt->llt_ifp->if_flags & IFF_LOOPBACK)
631 		return;
632 
633 	IF_AFDATA_WLOCK(llt->llt_ifp);
634 	lltable_foreach_lle(llt, llentry_update_ifaddr, llt->llt_ifp);
635 	IF_AFDATA_WUNLOCK(llt->llt_ifp);
636 }
637 
638 /*
639  *
640  * Performs generic cleanup routines and frees lle.
641  *
642  * Called for non-linked entries, with callouts and
643  * other AF-specific cleanups performed.
644  *
645  * @lle must be passed WLOCK'ed
646  *
647  * Returns the number of held packets, if any, that were dropped.
648  */
649 size_t
650 llentry_free(struct llentry *lle)
651 {
652 	size_t pkts_dropped;
653 
654 	LLE_WLOCK_ASSERT(lle);
655 
656 	KASSERT((lle->la_flags & LLE_LINKED) == 0, ("freeing linked lle"));
657 
658 	pkts_dropped = lltable_drop_entry_queue(lle);
659 
660 	/* cancel timer */
661 	if (callout_stop(&lle->lle_timer) > 0)
662 		LLE_REMREF(lle);
663 	LLE_FREE_LOCKED(lle);
664 
665 	return (pkts_dropped);
666 }
667 
668 /*
669  * Free all entries from given table and free itself.
670  */
671 
672 static int
673 lltable_free_cb(struct lltable *llt, struct llentry *lle, void *farg)
674 {
675 	struct llentries *dchain;
676 
677 	dchain = (struct llentries *)farg;
678 
679 	LLE_WLOCK(lle);
680 	CK_LIST_INSERT_HEAD(dchain, lle, lle_chain);
681 
682 	return (0);
683 }
684 
685 /*
686  * Free all entries from given table and free itself.
687  */
688 void
689 lltable_free(struct lltable *llt)
690 {
691 	struct llentry *lle, *next;
692 	struct llentries dchain;
693 
694 	KASSERT(llt != NULL, ("%s: llt is NULL", __func__));
695 
696 	lltable_unlink(llt);
697 
698 	CK_LIST_INIT(&dchain);
699 	IF_AFDATA_WLOCK(llt->llt_ifp);
700 	/* Push all lles to @dchain */
701 	lltable_foreach_lle(llt, lltable_free_cb, &dchain);
702 	llentries_unlink(llt, &dchain);
703 	IF_AFDATA_WUNLOCK(llt->llt_ifp);
704 
705 	CK_LIST_FOREACH_SAFE(lle, &dchain, lle_chain, next) {
706 		llentry_free(lle);
707 	}
708 
709 	KASSERT(llt->llt_entries == 0, ("%s: lltable %p (%s) entries not 0: %d",
710 	    __func__, llt, llt->llt_ifp->if_xname, llt->llt_entries));
711 
712 	llt->llt_free_tbl(llt);
713 }
714 
715 /*
716  * Deletes an address from given lltable.
717  * Used for userland interaction to remove
718  * individual entries. Skips entries added by OS.
719  */
720 int
721 lltable_delete_addr(struct lltable *llt, u_int flags,
722     const struct sockaddr *l3addr)
723 {
724 	struct llentry *lle;
725 	struct ifnet *ifp;
726 
727 	ifp = llt->llt_ifp;
728 	IF_AFDATA_WLOCK(ifp);
729 	lle = lla_lookup(llt, LLE_SF(l3addr->sa_family, LLE_EXCLUSIVE), l3addr);
730 
731 	if (lle == NULL) {
732 		IF_AFDATA_WUNLOCK(ifp);
733 		return (ENOENT);
734 	}
735 	if ((lle->la_flags & LLE_IFADDR) != 0 && (flags & LLE_IFADDR) == 0) {
736 		IF_AFDATA_WUNLOCK(ifp);
737 		LLE_WUNLOCK(lle);
738 		return (EPERM);
739 	}
740 
741 	lltable_unlink_entry(llt, lle);
742 	IF_AFDATA_WUNLOCK(ifp);
743 
744 	llt->llt_delete_entry(llt, lle);
745 
746 	return (0);
747 }
748 
749 void
750 lltable_prefix_free(int af, struct sockaddr *addr, struct sockaddr *mask,
751     u_int flags)
752 {
753 	struct lltable *llt;
754 
755 	LLTABLE_LIST_RLOCK();
756 	SLIST_FOREACH(llt, &V_lltables, llt_link) {
757 		if (llt->llt_af != af)
758 			continue;
759 
760 		llt->llt_prefix_free(llt, addr, mask, flags);
761 	}
762 	LLTABLE_LIST_RUNLOCK();
763 }
764 
765 /*
766  * Delete llentries that func() returns true.
767  */
768 struct lle_match_data {
769 	struct llentries dchain;
770 	llt_match_cb_t *func;
771 	void *farg;
772 };
773 
774 static int
775 lltable_delete_conditional_cb(struct lltable *llt, struct llentry *lle,
776     void *farg)
777 {
778 	struct lle_match_data *lmd;
779 
780 	lmd = (struct lle_match_data *)farg;
781 	if (lmd->func(llt, lle, lmd->farg)) {
782 		LLE_WLOCK(lle);
783 		CK_LIST_INSERT_HEAD(&lmd->dchain, lle, lle_chain);
784 	}
785 
786 	return (0);
787 }
788 
789 void
790 lltable_delete_conditional(struct lltable *llt, llt_match_cb_t *func,
791     void *farg)
792 {
793 	struct llentry *lle, *next;
794 	struct lle_match_data lmd;
795 
796 	bzero(&lmd, sizeof(lmd));
797 	CK_LIST_INIT(&lmd.dchain);
798 	lmd.func = func;
799 	lmd.farg = farg;
800 
801 	IF_AFDATA_WLOCK(llt->llt_ifp);
802 	lltable_foreach_lle(llt, lltable_delete_conditional_cb, &lmd);
803 	llentries_unlink(llt, &lmd.dchain);
804 	IF_AFDATA_WUNLOCK(llt->llt_ifp);
805 
806 	CK_LIST_FOREACH_SAFE(lle, &lmd.dchain, lle_chain, next)
807 		llt->llt_delete_entry(llt, lle);
808 }
809 
810 struct lltable *
811 lltable_allocate_htbl(uint32_t hsize)
812 {
813 	struct lltable *llt;
814 	int i;
815 
816 	llt = malloc(sizeof(struct lltable), M_LLTABLE, M_WAITOK | M_ZERO);
817 	llt->llt_hsize = hsize;
818 	llt->lle_head = malloc(sizeof(struct llentries) * hsize,
819 	    M_LLTABLE, M_WAITOK | M_ZERO);
820 
821 	for (i = 0; i < llt->llt_hsize; i++)
822 		CK_LIST_INIT(&llt->lle_head[i]);
823 
824 	/* Set some default callbacks */
825 	llt->llt_link_entry = htable_link_entry;
826 	llt->llt_unlink_entry = htable_unlink_entry;
827 	llt->llt_prefix_free = htable_prefix_free;
828 	llt->llt_foreach_entry = htable_foreach_lle;
829 	llt->llt_free_tbl = htable_free_tbl;
830 
831 	return (llt);
832 }
833 
834 /*
835  * Links lltable to global llt list.
836  */
837 void
838 lltable_link(struct lltable *llt)
839 {
840 
841 	LLTABLE_LIST_WLOCK();
842 	SLIST_INSERT_HEAD(&V_lltables, llt, llt_link);
843 	LLTABLE_LIST_WUNLOCK();
844 }
845 
846 static void
847 lltable_unlink(struct lltable *llt)
848 {
849 
850 	LLTABLE_LIST_WLOCK();
851 	SLIST_REMOVE(&V_lltables, llt, lltable, llt_link);
852 	LLTABLE_LIST_WUNLOCK();
853 
854 }
855 
856 /*
857  * Gets interface @ifp lltable for the specified @family
858  */
859 struct lltable *
860 lltable_get(struct ifnet *ifp, int family)
861 {
862 	switch (family) {
863 #ifdef INET
864 	case AF_INET:
865 		return (in_lltable_get(ifp));
866 #endif
867 #ifdef INET6
868 	case AF_INET6:
869 		return (in6_lltable_get(ifp));
870 #endif
871 	}
872 
873 	return (NULL);
874 }
875 
876 /*
877  * External methods used by lltable consumers
878  */
879 
880 int
881 lltable_foreach_lle(struct lltable *llt, llt_foreach_cb_t *f, void *farg)
882 {
883 
884 	return (llt->llt_foreach_entry(llt, f, farg));
885 }
886 
887 struct llentry *
888 lltable_alloc_entry(struct lltable *llt, u_int flags,
889     const struct sockaddr *l3addr)
890 {
891 
892 	return (llt->llt_alloc_entry(llt, flags, l3addr));
893 }
894 
895 void
896 lltable_free_entry(struct lltable *llt, struct llentry *lle)
897 {
898 
899 	llt->llt_free_entry(llt, lle);
900 }
901 
902 int
903 lltable_link_entry(struct lltable *llt, struct llentry *lle)
904 {
905 	int error = llt->llt_link_entry(llt, lle);
906 
907 	if (error == 0 && (lle->la_flags & LLE_PUB) != 0)
908 		llt->llt_flags |= LLT_ADDEDPROXY;
909 
910 	return (error);
911 }
912 
913 void
914 lltable_link_child_entry(struct llentry *lle, struct llentry *child_lle)
915 {
916 	child_lle->lle_parent = lle;
917 	child_lle->lle_tbl = lle->lle_tbl;
918 	child_lle->la_flags |= LLE_LINKED;
919 	CK_SLIST_INSERT_HEAD(&lle->lle_children, child_lle, lle_child_next);
920 }
921 
922 void
923 lltable_unlink_child_entry(struct llentry *child_lle)
924 {
925 	struct llentry *lle = child_lle->lle_parent;
926 
927 	child_lle->la_flags &= ~LLE_LINKED;
928 	child_lle->lle_parent = NULL;
929 	CK_SLIST_REMOVE(&lle->lle_children, child_lle, llentry, lle_child_next);
930 }
931 
932 int
933 lltable_unlink_entry(struct lltable *llt, struct llentry *lle)
934 {
935 
936 	return (llt->llt_unlink_entry(lle));
937 }
938 
939 void
940 lltable_fill_sa_entry(const struct llentry *lle, struct sockaddr *sa)
941 {
942 	struct lltable *llt;
943 
944 	llt = lle->lle_tbl;
945 	llt->llt_fill_sa_entry(lle, sa);
946 }
947 
948 struct ifnet *
949 lltable_get_ifp(const struct lltable *llt)
950 {
951 
952 	return (llt->llt_ifp);
953 }
954 
955 int
956 lltable_get_af(const struct lltable *llt)
957 {
958 
959 	return (llt->llt_af);
960 }
961 
962 /*
963  * Called in route_output when rtm_flags contains RTF_LLDATA.
964  */
965 int
966 lla_rt_output(struct rt_msghdr *rtm, struct rt_addrinfo *info)
967 {
968 	struct sockaddr_dl *dl =
969 	    (struct sockaddr_dl *)info->rti_info[RTAX_GATEWAY];
970 	struct sockaddr *dst = (struct sockaddr *)info->rti_info[RTAX_DST];
971 	struct ifnet *ifp;
972 	struct lltable *llt;
973 	struct llentry *lle, *lle_tmp;
974 	uint8_t linkhdr[LLE_MAX_LINKHDR];
975 	size_t linkhdrsize;
976 	int lladdr_off;
977 	u_int laflags = 0;
978 	int error;
979 
980 	if (dl == NULL || dl->sdl_family != AF_LINK)
981 		return (EINVAL);
982 
983 	/* XXX: should be ntohs() */
984 	ifp = ifnet_byindex(dl->sdl_index);
985 	if (ifp == NULL) {
986 		log(LOG_INFO, "%s: invalid ifp (sdl_index %d)\n",
987 		    __func__, dl->sdl_index);
988 		return EINVAL;
989 	}
990 
991 	llt = lltable_get(ifp, dst->sa_family);
992 
993 	if (llt == NULL)
994 		return (ESRCH);
995 
996 	error = 0;
997 
998 	switch (rtm->rtm_type) {
999 	case RTM_ADD:
1000 		/* Add static LLE */
1001 		laflags = 0;
1002 		if (rtm->rtm_rmx.rmx_expire == 0)
1003 			laflags = LLE_STATIC;
1004 		lle = lltable_alloc_entry(llt, laflags, dst);
1005 		if (lle == NULL)
1006 			return (ENOMEM);
1007 
1008 		linkhdrsize = sizeof(linkhdr);
1009 		if (lltable_calc_llheader(ifp, dst->sa_family, LLADDR(dl),
1010 		    linkhdr, &linkhdrsize, &lladdr_off) != 0) {
1011 			lltable_free_entry(llt, lle);
1012 			return (EINVAL);
1013 		}
1014 		lltable_set_entry_addr(ifp, lle, linkhdr, linkhdrsize,
1015 		    lladdr_off);
1016 		if ((rtm->rtm_flags & RTF_ANNOUNCE))
1017 			lle->la_flags |= LLE_PUB;
1018 		lle->la_expire = rtm->rtm_rmx.rmx_expire;
1019 
1020 		laflags = lle->la_flags;
1021 
1022 		/* Try to link new entry */
1023 		lle_tmp = NULL;
1024 		IF_AFDATA_WLOCK(ifp);
1025 		LLE_WLOCK(lle);
1026 		lle_tmp = lla_lookup(llt, LLE_EXCLUSIVE, dst);
1027 		if (lle_tmp != NULL) {
1028 			/* Check if we are trying to replace immutable entry */
1029 			if ((lle_tmp->la_flags & LLE_IFADDR) != 0) {
1030 				IF_AFDATA_WUNLOCK(ifp);
1031 				LLE_WUNLOCK(lle_tmp);
1032 				lltable_free_entry(llt, lle);
1033 				return (EPERM);
1034 			}
1035 			/* Unlink existing entry from table */
1036 			lltable_unlink_entry(llt, lle_tmp);
1037 		}
1038 		lltable_link_entry(llt, lle);
1039 		IF_AFDATA_WUNLOCK(ifp);
1040 
1041 		if (lle_tmp != NULL) {
1042 			EVENTHANDLER_INVOKE(lle_event, lle_tmp,LLENTRY_EXPIRED);
1043 			lltable_free_entry(llt, lle_tmp);
1044 		}
1045 
1046 		/*
1047 		 * By invoking LLE handler here we might get
1048 		 * two events on static LLE entry insertion
1049 		 * in routing socket. However, since we might have
1050 		 * other subscribers we need to generate this event.
1051 		 */
1052 		EVENTHANDLER_INVOKE(lle_event, lle, LLENTRY_RESOLVED);
1053 		LLE_WUNLOCK(lle);
1054 		llt->llt_post_resolved(llt, lle);
1055 		break;
1056 
1057 	case RTM_DELETE:
1058 		return (lltable_delete_addr(llt, 0, dst));
1059 
1060 	default:
1061 		error = EINVAL;
1062 	}
1063 
1064 	return (error);
1065 }
1066 
1067 #ifdef DDB
1068 static void
1069 llatbl_lle_show(struct llentry *lle)
1070 {
1071 	uint8_t octet[6];
1072 	sa_family_t af = AF_UNSPEC;
1073 	char l3_addr_fmt[] = " l3_addr=%s (af=%d)\n";
1074 
1075 	db_printf("lle=%p\n", lle);
1076 	db_printf(" lle_next=%p\n", lle->lle_next.cle_next);
1077 	db_printf(" lle_lock=%p\n", &lle->lle_lock);
1078 	db_printf(" lle_tbl=%p\n", lle->lle_tbl);
1079 	db_printf(" lle_head=%p\n", lle->lle_head);
1080 	db_printf(" la_hold=%p\n", lle->la_hold);
1081 	db_printf(" la_numheld=%d\n", lle->la_numheld);
1082 	db_printf(" la_expire=%ju\n", (uintmax_t)lle->la_expire);
1083 	db_printf(" la_flags=0x%04x\n", lle->la_flags);
1084 	db_printf(" la_asked=%u\n", lle->la_asked);
1085 	db_printf(" la_preempt=%u\n", lle->la_preempt);
1086 	db_printf(" ln_state=%d\n", lle->ln_state);
1087 	db_printf(" ln_router=%u\n", lle->ln_router);
1088 	db_printf(" ln_ntick=%ju\n", (uintmax_t)lle->ln_ntick);
1089 	db_printf(" lle_refcnt=%d\n", lle->lle_refcnt);
1090 	bcopy(lle->ll_addr, octet, sizeof(octet));
1091 	db_printf(" ll_addr=%02x:%02x:%02x:%02x:%02x:%02x\n",
1092 	    octet[0], octet[1], octet[2], octet[3], octet[4], octet[5]);
1093 	db_printf(" lle_timer=%p\n", &lle->lle_timer);
1094 
1095 	if (lle->lle_tbl) {
1096 		af = lle->lle_tbl->llt_af;
1097 	}
1098 
1099 	switch (af) {
1100 #ifdef INET
1101 	case AF_INET:
1102 	{
1103 		struct sockaddr_in sin;
1104 		char l3s[INET_ADDRSTRLEN];
1105 
1106 		lltable_fill_sa_entry(lle, (struct sockaddr *)&sin);
1107 		(void) inet_ntop(af, &sin.sin_addr, l3s, sizeof(l3s));
1108 		db_printf(l3_addr_fmt, l3s, af);
1109 		break;
1110 	}
1111 #endif
1112 #ifdef INET6
1113 	case AF_INET6:
1114 	{
1115 		struct sockaddr_in6 sin6;
1116 		char l3s[INET6_ADDRSTRLEN];
1117 
1118 		lltable_fill_sa_entry(lle, (struct sockaddr *)&sin6);
1119 		(void) inet_ntop(af, &sin6.sin6_addr, l3s, sizeof(l3s));
1120 		db_printf(l3_addr_fmt, l3s, af);
1121 		break;
1122 	}
1123 #endif
1124 	default:
1125 		db_printf(l3_addr_fmt, "N/A", af);
1126 		break;
1127 	}
1128 }
1129 
1130 DB_SHOW_COMMAND(llentry, db_show_llentry)
1131 {
1132 
1133 	if (!have_addr) {
1134 		db_printf("usage: show llentry <struct llentry *>\n");
1135 		return;
1136 	}
1137 
1138 	llatbl_lle_show((struct llentry *)addr);
1139 }
1140 
1141 static void
1142 llatbl_llt_show(struct lltable *llt)
1143 {
1144 	int i;
1145 	struct llentry *lle;
1146 
1147 	db_printf("llt=%p llt_af=%d llt_ifp=%p\n",
1148 	    llt, llt->llt_af, llt->llt_ifp);
1149 
1150 	for (i = 0; i < llt->llt_hsize; i++) {
1151 		CK_LIST_FOREACH(lle, &llt->lle_head[i], lle_next) {
1152 			llatbl_lle_show(lle);
1153 			if (db_pager_quit)
1154 				return;
1155 		}
1156 	}
1157 }
1158 
1159 DB_SHOW_COMMAND(lltable, db_show_lltable)
1160 {
1161 
1162 	if (!have_addr) {
1163 		db_printf("usage: show lltable <struct lltable *>\n");
1164 		return;
1165 	}
1166 
1167 	llatbl_llt_show((struct lltable *)addr);
1168 }
1169 
1170 DB_SHOW_ALL_COMMAND(lltables, db_show_all_lltables)
1171 {
1172 	VNET_ITERATOR_DECL(vnet_iter);
1173 	struct lltable *llt;
1174 
1175 	VNET_FOREACH(vnet_iter) {
1176 		CURVNET_SET_QUIET(vnet_iter);
1177 #ifdef VIMAGE
1178 		db_printf("vnet=%p\n", curvnet);
1179 #endif
1180 		SLIST_FOREACH(llt, &V_lltables, llt_link) {
1181 			db_printf("llt=%p llt_af=%d llt_ifp=%p(%s)\n",
1182 			    llt, llt->llt_af, llt->llt_ifp,
1183 			    (llt->llt_ifp != NULL) ?
1184 				llt->llt_ifp->if_xname : "?");
1185 			if (have_addr && addr != 0) /* verbose */
1186 				llatbl_llt_show(llt);
1187 			if (db_pager_quit) {
1188 				CURVNET_RESTORE();
1189 				return;
1190 			}
1191 		}
1192 		CURVNET_RESTORE();
1193 	}
1194 }
1195 #endif
1196