xref: /freebsd/sys/net/if_llatbl.c (revision c6ec7d31830ab1c80edae95ad5e4b9dba10c47ac)
1 /*
2  * Copyright (c) 2004 Luigi Rizzo, Alessandro Cerri. All rights reserved.
3  * Copyright (c) 2004-2008 Qing Li. All rights reserved.
4  * Copyright (c) 2008 Kip Macy. All rights reserved.
5  *
6  * Redistribution and use in source and binary forms, with or without
7  * modification, are permitted provided that the following conditions
8  * are met:
9  * 1. Redistributions of source code must retain the above copyright
10  *    notice, this list of conditions and the following disclaimer.
11  * 2. Redistributions in binary form must reproduce the above copyright
12  *    notice, this list of conditions and the following disclaimer in the
13  *    documentation and/or other materials provided with the distribution.
14  *
15  * THIS SOFTWARE IS PROVIDED BY AUTHOR AND CONTRIBUTORS ``AS IS'' AND
16  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
17  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
18  * ARE DISCLAIMED.  IN NO EVENT SHALL AUTHOR OR CONTRIBUTORS BE LIABLE
19  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
20  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
21  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
22  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
23  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
24  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
25  * SUCH DAMAGE.
26  */
27 #include <sys/cdefs.h>
28 __FBSDID("$FreeBSD$");
29 
30 #include "opt_ddb.h"
31 #include "opt_inet.h"
32 #include "opt_inet6.h"
33 
34 #include <sys/param.h>
35 #include <sys/systm.h>
36 #include <sys/malloc.h>
37 #include <sys/mbuf.h>
38 #include <sys/syslog.h>
39 #include <sys/sysctl.h>
40 #include <sys/socket.h>
41 #include <sys/kernel.h>
42 #include <sys/lock.h>
43 #include <sys/mutex.h>
44 #include <sys/rwlock.h>
45 
46 #ifdef DDB
47 #include <ddb/ddb.h>
48 #endif
49 
50 #include <vm/uma.h>
51 
52 #include <netinet/in.h>
53 #include <net/if_llatbl.h>
54 #include <net/if.h>
55 #include <net/if_dl.h>
56 #include <net/if_var.h>
57 #include <net/route.h>
58 #include <net/vnet.h>
59 #include <netinet/if_ether.h>
60 #include <netinet6/in6_var.h>
61 #include <netinet6/nd6.h>
62 
63 MALLOC_DEFINE(M_LLTABLE, "lltable", "link level address tables");
64 
65 static VNET_DEFINE(SLIST_HEAD(, lltable), lltables);
66 #define	V_lltables	VNET(lltables)
67 
68 static void vnet_lltable_init(void);
69 
70 struct rwlock lltable_rwlock;
71 RW_SYSINIT(lltable_rwlock, &lltable_rwlock, "lltable_rwlock");
72 
73 /*
74  * Dump arp state for a specific address family.
75  */
76 int
77 lltable_sysctl_dumparp(int af, struct sysctl_req *wr)
78 {
79 	struct lltable *llt;
80 	int error = 0;
81 
82 	LLTABLE_RLOCK();
83 	SLIST_FOREACH(llt, &V_lltables, llt_link) {
84 		if (llt->llt_af == af) {
85 			error = llt->llt_dump(llt, wr);
86 			if (error != 0)
87 				goto done;
88 		}
89 	}
90 done:
91 	LLTABLE_RUNLOCK();
92 	return (error);
93 }
94 
95 /*
96  * Deletes an address from the address table.
97  * This function is called by the timer functions
98  * such as arptimer() and nd6_llinfo_timer(), and
99  * the caller does the locking.
100  *
101  * Returns the number of held packets, if any, that were dropped.
102  */
103 size_t
104 llentry_free(struct llentry *lle)
105 {
106 	size_t pkts_dropped;
107 	struct mbuf *next;
108 
109 	IF_AFDATA_WLOCK_ASSERT(lle->lle_tbl->llt_ifp);
110 	LLE_WLOCK_ASSERT(lle);
111 
112 	LIST_REMOVE(lle, lle_next);
113 	lle->la_flags &= ~(LLE_VALID | LLE_LINKED);
114 
115 	pkts_dropped = 0;
116 	while ((lle->la_numheld > 0) && (lle->la_hold != NULL)) {
117 		next = lle->la_hold->m_nextpkt;
118 		m_freem(lle->la_hold);
119 		lle->la_hold = next;
120 		lle->la_numheld--;
121 		pkts_dropped++;
122 	}
123 
124 	KASSERT(lle->la_numheld == 0,
125 		("%s: la_numheld %d > 0, pkts_droped %zd", __func__,
126 		 lle->la_numheld, pkts_dropped));
127 
128 	LLE_FREE_LOCKED(lle);
129 
130 	return (pkts_dropped);
131 }
132 
133 /*
134  * (al)locate an llentry for address dst (equivalent to rtalloc for new-arp).
135  *
136  * If found the llentry * is returned referenced and unlocked.
137  */
138 struct llentry *
139 llentry_alloc(struct ifnet *ifp, struct lltable *lt,
140     struct sockaddr_storage *dst)
141 {
142 	struct llentry *la;
143 
144 	IF_AFDATA_RLOCK(ifp);
145 	la = lla_lookup(lt, LLE_EXCLUSIVE, (struct sockaddr *)dst);
146 	IF_AFDATA_RUNLOCK(ifp);
147 	if ((la == NULL) &&
148 	    (ifp->if_flags & (IFF_NOARP | IFF_STATICARP)) == 0) {
149 		IF_AFDATA_WLOCK(ifp);
150 		la = lla_lookup(lt, (LLE_CREATE | LLE_EXCLUSIVE),
151 		    (struct sockaddr *)dst);
152 		IF_AFDATA_WUNLOCK(ifp);
153 	}
154 
155 	if (la != NULL) {
156 		LLE_ADDREF(la);
157 		LLE_WUNLOCK(la);
158 	}
159 
160 	return (la);
161 }
162 
163 /*
164  * Free all entries from given table and free itself.
165  */
166 void
167 lltable_free(struct lltable *llt)
168 {
169 	struct llentry *lle, *next;
170 	int i;
171 
172 	KASSERT(llt != NULL, ("%s: llt is NULL", __func__));
173 
174 	LLTABLE_WLOCK();
175 	SLIST_REMOVE(&V_lltables, llt, lltable, llt_link);
176 	LLTABLE_WUNLOCK();
177 
178 	IF_AFDATA_WLOCK(llt->llt_ifp);
179 	for (i = 0; i < LLTBL_HASHTBL_SIZE; i++) {
180 		LIST_FOREACH_SAFE(lle, &llt->lle_head[i], lle_next, next) {
181 			LLE_WLOCK(lle);
182 			if (callout_stop(&lle->la_timer))
183 				LLE_REMREF(lle);
184 			llentry_free(lle);
185 		}
186 	}
187 	IF_AFDATA_WUNLOCK(llt->llt_ifp);
188 
189 	free(llt, M_LLTABLE);
190 }
191 
192 #if 0
193 void
194 lltable_drain(int af)
195 {
196 	struct lltable	*llt;
197 	struct llentry	*lle;
198 	register int i;
199 
200 	LLTABLE_RLOCK();
201 	SLIST_FOREACH(llt, &V_lltables, llt_link) {
202 		if (llt->llt_af != af)
203 			continue;
204 
205 		for (i=0; i < LLTBL_HASHTBL_SIZE; i++) {
206 			LIST_FOREACH(lle, &llt->lle_head[i], lle_next) {
207 				LLE_WLOCK(lle);
208 				if (lle->la_hold) {
209 					m_freem(lle->la_hold);
210 					lle->la_hold = NULL;
211 				}
212 				LLE_WUNLOCK(lle);
213 			}
214 		}
215 	}
216 	LLTABLE_RUNLOCK();
217 }
218 #endif
219 
220 void
221 lltable_prefix_free(int af, struct sockaddr *prefix, struct sockaddr *mask,
222     u_int flags)
223 {
224 	struct lltable *llt;
225 
226 	LLTABLE_RLOCK();
227 	SLIST_FOREACH(llt, &V_lltables, llt_link) {
228 		if (llt->llt_af != af)
229 			continue;
230 
231 		llt->llt_prefix_free(llt, prefix, mask, flags);
232 	}
233 	LLTABLE_RUNLOCK();
234 }
235 
236 
237 
238 /*
239  * Create a new lltable.
240  */
241 struct lltable *
242 lltable_init(struct ifnet *ifp, int af)
243 {
244 	struct lltable *llt;
245 	register int i;
246 
247 	llt = malloc(sizeof(struct lltable), M_LLTABLE, M_WAITOK);
248 
249 	llt->llt_af = af;
250 	llt->llt_ifp = ifp;
251 	for (i = 0; i < LLTBL_HASHTBL_SIZE; i++)
252 		LIST_INIT(&llt->lle_head[i]);
253 
254 	LLTABLE_WLOCK();
255 	SLIST_INSERT_HEAD(&V_lltables, llt, llt_link);
256 	LLTABLE_WUNLOCK();
257 
258 	return (llt);
259 }
260 
261 /*
262  * Called in route_output when adding/deleting a route to an interface.
263  */
264 int
265 lla_rt_output(struct rt_msghdr *rtm, struct rt_addrinfo *info)
266 {
267 	struct sockaddr_dl *dl =
268 	    (struct sockaddr_dl *)info->rti_info[RTAX_GATEWAY];
269 	struct sockaddr *dst = (struct sockaddr *)info->rti_info[RTAX_DST];
270 	struct ifnet *ifp;
271 	struct lltable *llt;
272 	struct llentry *lle;
273 	u_int laflags = 0, flags = 0;
274 	int error = 0;
275 
276 	if (dl == NULL || dl->sdl_family != AF_LINK) {
277 		log(LOG_INFO, "%s: invalid dl\n", __func__);
278 		return EINVAL;
279 	}
280 	ifp = ifnet_byindex(dl->sdl_index);
281 	if (ifp == NULL) {
282 		log(LOG_INFO, "%s: invalid ifp (sdl_index %d)\n",
283 		    __func__, dl->sdl_index);
284 		return EINVAL;
285 	}
286 
287 	switch (rtm->rtm_type) {
288 	case RTM_ADD:
289 		if (rtm->rtm_flags & RTF_ANNOUNCE) {
290 			flags |= LLE_PUB;
291 #ifdef INET
292 			if (dst->sa_family == AF_INET &&
293 			    ((struct sockaddr_inarp *)dst)->sin_other != 0) {
294 				struct rtentry *rt;
295 				((struct sockaddr_inarp *)dst)->sin_other = 0;
296 				rt = rtalloc1(dst, 0, 0);
297 				if (rt == NULL || !(rt->rt_flags & RTF_HOST)) {
298 					log(LOG_INFO, "%s: RTM_ADD publish "
299 					    "(proxy only) is invalid\n",
300 					    __func__);
301 					if (rt)
302 						RTFREE_LOCKED(rt);
303 					return EINVAL;
304 				}
305 				RTFREE_LOCKED(rt);
306 
307 				flags |= LLE_PROXY;
308 			}
309 #endif
310 		}
311 		flags |= LLE_CREATE;
312 		break;
313 
314 	case RTM_DELETE:
315 		flags |= LLE_DELETE;
316 		break;
317 
318 	case RTM_CHANGE:
319 		break;
320 
321 	default:
322 		return EINVAL; /* XXX not implemented yet */
323 	}
324 
325 	/* XXX linked list may be too expensive */
326 	LLTABLE_RLOCK();
327 	SLIST_FOREACH(llt, &V_lltables, llt_link) {
328 		if (llt->llt_af == dst->sa_family &&
329 		    llt->llt_ifp == ifp)
330 			break;
331 	}
332 	LLTABLE_RUNLOCK();
333 	KASSERT(llt != NULL, ("Yep, ugly hacks are bad\n"));
334 
335 	if (flags & LLE_CREATE)
336 		flags |= LLE_EXCLUSIVE;
337 
338 	IF_AFDATA_LOCK(ifp);
339 	lle = lla_lookup(llt, flags, dst);
340 	IF_AFDATA_UNLOCK(ifp);
341 	if (LLE_IS_VALID(lle)) {
342 		if (flags & LLE_CREATE) {
343 			/*
344 			 * If we delay the delete, then a subsequent
345 			 * "arp add" should look up this entry, reset the
346 			 * LLE_DELETED flag, and reset the expiration timer
347 			 */
348 			bcopy(LLADDR(dl), &lle->ll_addr, ifp->if_addrlen);
349 			lle->la_flags |= (flags & (LLE_PUB | LLE_PROXY));
350 			lle->la_flags |= LLE_VALID;
351 			lle->la_flags &= ~LLE_DELETED;
352 #ifdef INET6
353 			/*
354 			 * ND6
355 			 */
356 			if (dst->sa_family == AF_INET6)
357 				lle->ln_state = ND6_LLINFO_REACHABLE;
358 #endif
359 			/*
360 			 * NB: arp and ndp always set (RTF_STATIC | RTF_HOST)
361 			 */
362 
363 			if (rtm->rtm_rmx.rmx_expire == 0) {
364 				lle->la_flags |= LLE_STATIC;
365 				lle->la_expire = 0;
366 			} else
367 				lle->la_expire = rtm->rtm_rmx.rmx_expire;
368 			laflags = lle->la_flags;
369 			LLE_WUNLOCK(lle);
370 #ifdef INET
371 			/*  gratuitous ARP */
372 			if ((laflags & LLE_PUB) && dst->sa_family == AF_INET) {
373 				arprequest(ifp,
374 				    &((struct sockaddr_in *)dst)->sin_addr,
375 				    &((struct sockaddr_in *)dst)->sin_addr,
376 				    ((laflags & LLE_PROXY) ?
377 					(u_char *)IF_LLADDR(ifp) :
378 					(u_char *)LLADDR(dl)));
379 			}
380 #endif
381 		} else {
382 			if (flags & LLE_EXCLUSIVE)
383 				LLE_WUNLOCK(lle);
384 			else
385 				LLE_RUNLOCK(lle);
386 		}
387 	} else if ((lle == NULL) && (flags & LLE_DELETE))
388 		error = EINVAL;
389 
390 
391 	return (error);
392 }
393 
394 static void
395 vnet_lltable_init()
396 {
397 
398 	SLIST_INIT(&V_lltables);
399 }
400 VNET_SYSINIT(vnet_lltable_init, SI_SUB_PSEUDO, SI_ORDER_FIRST,
401     vnet_lltable_init, NULL);
402 
403 #ifdef DDB
404 struct llentry_sa {
405 	struct llentry		base;
406 	struct sockaddr		l3_addr;
407 };
408 
409 static void
410 llatbl_lle_show(struct llentry_sa *la)
411 {
412 	struct llentry *lle;
413 	uint8_t octet[6];
414 
415 	lle = &la->base;
416 	db_printf("lle=%p\n", lle);
417 	db_printf(" lle_next=%p\n", lle->lle_next.le_next);
418 	db_printf(" lle_lock=%p\n", &lle->lle_lock);
419 	db_printf(" lle_tbl=%p\n", lle->lle_tbl);
420 	db_printf(" lle_head=%p\n", lle->lle_head);
421 	db_printf(" la_hold=%p\n", lle->la_hold);
422 	db_printf(" la_numheld=%d\n", lle->la_numheld);
423 	db_printf(" la_expire=%ju\n", (uintmax_t)lle->la_expire);
424 	db_printf(" la_flags=0x%04x\n", lle->la_flags);
425 	db_printf(" la_asked=%u\n", lle->la_asked);
426 	db_printf(" la_preempt=%u\n", lle->la_preempt);
427 	db_printf(" ln_byhint=%u\n", lle->ln_byhint);
428 	db_printf(" ln_state=%d\n", lle->ln_state);
429 	db_printf(" ln_router=%u\n", lle->ln_router);
430 	db_printf(" ln_ntick=%ju\n", (uintmax_t)lle->ln_ntick);
431 	db_printf(" lle_refcnt=%d\n", lle->lle_refcnt);
432 	bcopy(&lle->ll_addr.mac16, octet, sizeof(octet));
433 	db_printf(" ll_addr=%02x:%02x:%02x:%02x:%02x:%02x\n",
434 	    octet[0], octet[1], octet[2], octet[3], octet[4], octet[5]);
435 	db_printf(" la_timer=%p\n", &lle->la_timer);
436 
437 	switch (la->l3_addr.sa_family) {
438 #ifdef INET
439 	case AF_INET:
440 	{
441 		struct sockaddr_in *sin;
442 		char l3s[INET_ADDRSTRLEN];
443 
444 		sin = (struct sockaddr_in *)&la->l3_addr;
445 		inet_ntoa_r(sin->sin_addr, l3s);
446 		db_printf(" l3_addr=%s\n", l3s);
447 		break;
448 	}
449 #endif
450 #ifdef INET6
451 	case AF_INET6:
452 	{
453 		struct sockaddr_in6 *sin6;
454 		char l3s[INET6_ADDRSTRLEN];
455 
456 		sin6 = (struct sockaddr_in6 *)&la->l3_addr;
457 		ip6_sprintf(l3s, &sin6->sin6_addr);
458 		db_printf(" l3_addr=%s\n", l3s);
459 		break;
460 	}
461 #endif
462 	default:
463 		db_printf(" l3_addr=N/A (af=%d)\n", la->l3_addr.sa_family);
464 		break;
465 	}
466 }
467 
468 DB_SHOW_COMMAND(llentry, db_show_llentry)
469 {
470 
471 	if (!have_addr) {
472 		db_printf("usage: show llentry <struct llentry *>\n");
473 		return;
474 	}
475 
476 	llatbl_lle_show((struct llentry_sa *)addr);
477 }
478 
479 static void
480 llatbl_llt_show(struct lltable *llt)
481 {
482 	int i;
483 	struct llentry *lle;
484 
485 	db_printf("llt=%p llt_af=%d llt_ifp=%p\n",
486 	    llt, llt->llt_af, llt->llt_ifp);
487 
488 	for (i = 0; i < LLTBL_HASHTBL_SIZE; i++) {
489 		LIST_FOREACH(lle, &llt->lle_head[i], lle_next) {
490 
491 			llatbl_lle_show((struct llentry_sa *)lle);
492 			if (db_pager_quit)
493 				return;
494 		}
495 	}
496 }
497 
498 DB_SHOW_COMMAND(lltable, db_show_lltable)
499 {
500 
501 	if (!have_addr) {
502 		db_printf("usage: show lltable <struct lltable *>\n");
503 		return;
504 	}
505 
506 	llatbl_llt_show((struct lltable *)addr);
507 }
508 
509 DB_SHOW_ALL_COMMAND(lltables, db_show_all_lltables)
510 {
511 	VNET_ITERATOR_DECL(vnet_iter);
512 	struct lltable *llt;
513 
514 	VNET_FOREACH(vnet_iter) {
515 		CURVNET_SET_QUIET(vnet_iter);
516 #ifdef VIMAGE
517 		db_printf("vnet=%p\n", curvnet);
518 #endif
519 		SLIST_FOREACH(llt, &V_lltables, llt_link) {
520 			db_printf("llt=%p llt_af=%d llt_ifp=%p(%s)\n",
521 			    llt, llt->llt_af, llt->llt_ifp,
522 			    (llt->llt_ifp != NULL) ?
523 				llt->llt_ifp->if_xname : "?");
524 			if (have_addr && addr != 0) /* verbose */
525 				llatbl_llt_show(llt);
526 			if (db_pager_quit) {
527 				CURVNET_RESTORE();
528 				return;
529 			}
530 		}
531 		CURVNET_RESTORE();
532 	}
533 }
534 #endif
535